Uzun zamandır İnternet olayının içinde olmama rağmen şimdiye dek spam postalar ile hiç derdim olmamıştı. Hotmail, Gmail ve Volkanvardar.com hesaplarıma günde toplam ortalama 50 tane junk tabirine uyacak mail geliyor ve bunların neredeyse hepsi filtrelere takılarak spam klasörüne düşüyor. Yakalanamayanlar da genellikle konusundan anlaşılarak tarafımdan siliniyordu. Bu yıllardır beni hiç üzmeyecek şekilde böyle devam ediyor. Lakin bir haftadır ilginç bir şekilde şirket hesabıma spam mailler yağmaya başladı.
Outlook başedemeyince 3rd party yazılım incelemesi yaptım ve open source'a inanan biri olarak SourceForge'dan
SpamBayes'i buldum. Hemen kurup denemeye başladım, sonuç oldukça başarılıydı. Ama beni en çok öğrenme mekanizması etkiledi. Düzgün mesajları ve junk mesajları farklı klasörlere koyup bu elemana çalışması için verdiğinizde maillerdeki kelimeleri ayrı ayrı inceleyip skorlandırıyor. Ve bundan sonra çalışırken de bu puanları kullanıyor. Örneğin yakalayamadığı bir maili junk olarak işaretlediğinizde hemen o maili tekrar inceleyip database'ini güncelliyor.
Birkaç gün maillerinizi incelenmesi ile geçtikten sonra maillerinizi puanlandırarak 3'e ayırıyor : Spam, Ham (düzgün), Unsure (arada). %90 ve üzeri puan almışsa direk olarak spam folder'ına atılıyor, %15 - %90 arası ise Suspect folder'ına, %15 aşağısı ise güvenli olarak bırakılıyor. Bu değerler istenildiği gibi ayarlanıyor. Yani tamamiyle sizin maillerinize bakarak öğreniyor. Zaten ismi de buradan geliyor :
Thomas Bayes amca bir olayın ileride olma ihtimalini geçmişteki durumlarda oluşan olma ve olmama istatistiklerinden hareketle hesaplamıştır.
Benim Bayesian'ı duyduğum ilk yer ise imdb.com olmuştur. Onlar da
Top 250 listesini true Bayesian estimate ile hesaplamaktadırlar, puanı yüksek olduğu halde listeye giremeyen filmler de bu yüzdendir.
etiketler :
spam