Вешаться стал теперь практически каждый день. Включил ExtendedStatus On
Когда апач висит - apache2ctl fullstatus не открывается, т.к. нет свободных процессов.
Настроил мониторинг на большое кол-во процессов и всё же поймал момент когда он собирается повесится. В это время большая часть процессов апача висит в статусе W уже долгое время. Выглядит это примерно так: Srv PID Acc M CPU SS Req Conn Child Slot Client VHost Request
0-22 6607 0/5/ W 21.99 559 0 0.0 0.07 32.09 67.195.37.94 site.ru GET / HTTP/1.0
4864
0/
1-22 3984 311/ W 465.16 173 0 0.0 0.65 35.55 74.6.22.176 site.ru GET /catalog/hygienic_products/dispenser/toilet_paper_big_rolls
5077
2-22 6608 0/6/ W 16.09 708 0 0.0 0.00 29.27 74.6.17.173 site.ru GET /catalog/product1/auto-wash/truck/avtomaticheskaja-mojka-rbh
4957
0/
3-22 6302 115/ W 26.11 624 0 0.0 0.60 27.89 74.6.8.103 site.ru GET /catalog/product1/sweep-machine/ride_on HTTP/1.0
4661
0/
4-22 5559 148/ W 121.83 278 0 0.0 0.73 27.87 67.195.37.94 site3.ru GET / HTTP/1.0
4317
0/49
5-22 5561 / W 199.19 115 0 0.0 0.57 39.47 74.6.22.176 site2.ru GET / HTTP/1.0
4606
0/
6-22 2802 491/ W 200.80 645 0 0.0 2.07 27.13 74.6.8.103 site.ru GET /catalog/product1/sweep-machine/ride_on HTTP/1.0
4434
7-22 7366 0/2/ W 0.00 552 0 0.0 0.03 25.09 74.6.17.173 site.ru GET /catalog/product1-home/domestic/vacuum_water_filter HTTP/1.0
4146
0/
8-22 7370 101/ W 0.18 538 0 0.0 0.23 30.58 67.195.37.94 site.ru GET / HTTP/1.0
4143
0/12
9-22 6609 / W 29.16 6 0 0.0 0.09 31.19 74.6.22.176 site.ru GET /catalog/hygienic_products/dispenser/toilet_paper_big_rolls
4183
0/
10-22 6695 110/ W 26.81 156 0 0.0 0.26 31.40 74.6.22.176 site.ru GET / HTTP/1.0
3783
11-22 11009 0/0/ _ 86.18 36 0 0.0 0.00 22.27 ::1 site2.ru OPTIONS * HTTP/1.0
4090
0/42
12-22 6377 / W 38.53 342 0 0.0 0.39 50.02 74.6.22.176 site.ru GET / HTTP/1.0
3363
13-22 6697 0/8/ W 25.76 508 0 0.0 0.06 21.92 74.6.8.103 site.ru GET /catalog/product1/pressure/hot/hds-558-c-eco.html HTTP/1.0
3971
14-22 6698 0/6/ W 29.26 280 0 0.0 0.00 27.58 74.6.22.176 site.ru GET / HTTP/1.0
3434
0/
15-22 6502 111/ W 37.09 199 0 0.0 0.31 36.54 74.6.8.103 site.ru GET /catalog/product1/auto-wash/car/avtomaticheskaja-mojka-chh-8
2733
И таких процессов с SS>300 и до сих пор как бы отдающих данные клиенту - более 100. Причем вешается и ночью, когда нагрузка минимальна. Всё остальное время в нормальном рабочем режиме - кол-во процессов висит на уровне 10-15 изредка поднимаясь до 40.
Просто видимо что-то происходит с апачем и он перестает закрывать соединения, тем самым доходя до своего лимита процессов и вешаясь.
Подскажите что ещё можно проанализировать в момент когда он "вот-вот повеситься" чтобы поточнее проблему найти?