Walka ze spamem w obrazkach przy użyciu FuzzyOcr w Debianie

W ostatnim czasie pojawiło się wiele maili spamowych, których treść ukryta jest w obrazku. Filtry spamowe takie jak SpamAssassin nie radzą sobie zbyt dobrze z tego typu spamem. Ciągłe uczenie bayesa bądz dodawanie źródeł spamu do blacklisty jest uciążliwe. Z pomocą przychodzi nam plugin do SpamAssassina o nazwie FuzzyOcr, który analizuje tekst załączonych obrazków oraz ich właściwości i klasyfikuje maila do spamu bądz hamu. Na pierwszy rzut oka taka funkcjonalność wydaje się zasobożerna, jednak plugin jest na tyle sprytny, że skanuje jedynie te maile, które nie zostały wcześniej zaklasyfikowane do spamu przez SpamAssassina co pozwala zachować obciążenie serwera na niskim poziomie.

Opis, który tutaj zamieściłem bazuje na Debianie Etch (4.0), SpamAssassinie 3.1.7 oraz FuzzyOcr 3.5.1.
(more…)



The accumulation of points and extra discounts makes favorable re-order in Canadian drug pharmacy "'&$ drug list and permanent system of discounts for buyers.