> но некоторые письма с русскоязычным спамом просачиваются...
> обучение ведется... с бесом экспериментировал...Как много писем просачивается? Можете прикинуть хотя бы на глаз три показателя:
- отношение входящего спама к хэму
- отношение пропущенного спама к отсеяному
- отношение пропущенного спама к хэму
Стопроцентного отсеивания не гарантирует ни одна система. Даже гугломейл, при всей его моще, на прошлой неделе пропустил ко мне около десятка спамовых писем. Спамеры ищут обходов вокруг байесов, и время от времени появляются новые техники, которые приводят к пробою спаморезки. Единственное, что может помочь - это постоянное дообучение байеса силами юзеров. Кстати, платные сервисы, продающие доступ к спам-фильтрам, эти спам-фильтры формируют тоже вручную, артелями молотобойцев, которые сортируют письма. Никакого волшебства.
Поэтому, если СА пропускает некоторое количество спама - это нормально. Другое дело, что это количество не должно быть слишком высоко. На моих серверах на тысячу попыток впихнуть спам, удачей завершаются 1-2. На 1-2 спамовых письма приходится 50-60 нормальных писем. То-есть, абсолютный показатель фильтрации - 99.8%, относительный - 97%. Можно получить и более высокие значения, но тогда резко возрастает риск получить фальш-позитив. А мои клиенты этого не любят.