>Кстати, а оно не может быть связано с процессом pagezero? В пределе может быть связано с чем угодно. Из своего опыта могу только вспомнить, что как-то был аномальный sys% из-за грязной ФС и mysql с его binlog-ом - сервер был не боевой, но под активным юзанием. После сбоя питания никто не проверил таблицы мускуля на покоцанность, а fsck при старте ФС прочекал, но не исправил. При отключении сервера от сетки (чтоб доп. нагрузку никто не создавал) оставалось невнятное шуршание дисками, видимое по iostat и загрузка sys cpu. Ребутнулись в single-user, чтобы все разделы были отмонтированы, fsck-нули всё (была куууча исправлений), перегрузились и все прошло.
Если fsck пустить без ключей - он исправлять ничего не будет, а просто выведет косяки, какие найдет. И раздел отмонтировать не надо.
Впрочем, у вас, видимо, не с дисками беда.
>На других серверах есть vm.idlezero_enable: 0 и vm.idlezero_enable: 1. Но нигде это
>руками не включалось и не выключалось. Но такой проблемы не наблюдается.
vm.idlezero_enable - это "Allow the kernel to use idle cpu cycles to zero-out pages", поставьте в ноль и поглядите, что получится.
А вот vm.stats.misc.cnt_prezero (The number of physical pages prezeroed at idle time) интересно почему отрицательный. overflow, что ли уже был за 12 дней аптайма. Да и zero_page_count = 0...