Günde yüzlerce e-posta alan kurumsal ekipler için gelen kutusunu manuel olarak yönetmek hem zaman kaybı hem de hata kaynağıdır. Otomatik e-posta sınıflandırma sistemleri; kural tabanlı filtrelerden makine öğrenimi modellerine uzanan geniş bir yelpazede, her ölçekten işletmenin iş akışını kolaylaştırmasına olanak tanır.
E-posta sınıflandırması, gelen iletilerin belirli ölçütlere göre otomatik olarak klasörlere, etiketlere veya iş akışlarına yönlendirilmesi sürecidir. RFC 3501'de tanımlanan IMAP protokolü, sunucu taraflı klasör yapısını ve istemci–sunucu senkronizasyon mekanizmasını standartlaştırarak bu tür sistemlerin temelini oluşturur. IMAP'ın aksine POP3, iletileri yalnızca yerel cihaza indirir; bu nedenle sunucu tabanlı sınıflandırma için IMAP ya da modern API'ler tercih edilmelidir.
Sınıflandırma mantığı üç temel katmana ayrılır: sunucu taraflı filtreler (Sieve betikleri, Exchange kuralları), istemci taraflı filtreler (Outlook kuralları, Apple Mail akıllı posta kutuları) ve yapay zeka destekli sınıflandırıcılar (Google'ın Gmail öncelikli gelen kutusu, Microsoft 365 Focused Inbox). Bu katmanları doğru kombinasyonda kullanmak, hem performans hem de esneklik açısından en iyi sonucu verir.
RFC 5228 kapsamında standartlaştırılan Sieve betik dili, IMAP sunucularında mesajları teslim öncesinde sınıflandırmak için yaygın biçimde kullanılır. Dovecot, Cyrus ve Postfix+Dovecot kombinasyonları Sieve desteği sunar; betikler sunucu yöneticisi aracılığıyla ya da ManageSieve protokolü (RFC 5804) üzerinden son kullanıcı tarafından yüklenebilir. Örnek bir Sieve kuralı şu şekilde görünür:
require ["fileinto", "imap4flags"];
if header :contains "From" "fatura@tedarikci.com" {
fileinto "Finans/Faturalar";
setflag "\\Seen";
}
Microsoft Exchange ve Microsoft 365 ortamlarında ise Exchange Yönetim Merkezi (EAC) veya PowerShell cmdlet'leri aracılığıyla Aktarım Kuralları (Transport Rules) tanımlanabilir. Bu kurallar; başlık analizi, içerik taraması ve hassas veri tespiti dahil çok katmanlı koşul mantığı destekler. Microsoft'un resmi Microsoft 365 belgelerine göre Aktarım Kuralları, iletiler posta kutusuna ulaşmadan önce uygulanır ve bu nedenle istemci kurallarına göre çok daha güvenilir çalışır.
Etkili bir sınıflandırma sistemi kurarken kural önceliği (priority/order) doğru belirlenmezse çakışmalar kaçınılmaz hale gelir. Aşağıdaki tablo, tipik bir kurumsal senaryoda kural katmanlarını ve eylem türlerini özetlemektedir:
| Kural Türü | Koşul Örneği | Eylem | Öncelik |
|---|---|---|---|
| Spam / Phishing Engeli | SPF/DKIM başarısız + şüpheli bağlantı | Karantinaya al veya sil | 1 (En yüksek) |
| Yasal Bildirim | Konu: "tebligat" VEYA "icra" | Hukuk klasörüne taşı + bildirim gönder | 2 |
| Müşteri Talebi | Gönderen destek@* + konu "talep" | CRM'e ilet + "Destek" etiketle | 3 |
| Fatura / Finans | Ek: PDF + tutar anahtar sözcüğü | Finans klasörüne taşı | 4 |
| Bülten / Abonelik | List-Unsubscribe başlığı mevcut | "Bültenler" klasörüne taşı | 5 |
| Genel Yazışma | Yukarıdaki koşulların hiçbiri | Gelen kutusunda bırak | 6 (En düşük) |
Kural tabanlı sistemler öngörülebilir ve denetlenebilir olsa da yeni e-posta kalıplarına uyum sağlayamazlar. Bu boşluğu doldurmak için Naive Bayes, destek vektör makineleri (SVM) veya transformer tabanlı dil modelleri gibi istatistiksel sınıflandırıcılar kullanılmaktadır. Google'ın 2015 yılında yayımladığı öncelikli gelen kutusu araştırmasına göre bu modeller, logistik regresyon ve sosyal grafik sinyallerini birleştirerek çalışmakta olup söz konusu yaklaşım hâlâ Gmail'in Focused Inbox benzeri özelliklerinin temelini oluşturmaktadır.
Kendi modelinizi eğitmek istiyorsanız açık kaynaklı Apache SpamAssassin veya rspamd gibi araçlardan başlayabilirsiniz. rspamd, Lua tabanlı eklenti mimarisi sayesinde hem kural tabanlı hem de sinir ağı puanlama (neural scoring) özelliklerini aynı anda çalıştırabilir. Python ekosisteminde ise scikit-learn veya Hugging Face transformers kütüphaneleriyle e-posta gövdesi ve başlık özelliklerini birleştiren bir sınıflandırıcı birkaç yüz etiketlenmiş örnekle bile işlevsel sonuçlar üretebilir.
Sınıflandırma kararlarını iş süreçlerine bağlamak için e-posta servisi API'leri kritik rol oynar. Microsoft Graph API, Microsoft 365 posta kutularında gelen her ileti için webhook aboneliği (subscription) oluşturmanıza ve sınıflandırma mantığını harici bir uç noktaya taşımanıza olanak tanır. Google Workspace tarafında ise Gmail API'nin users.messages.modify ve users.labels uç noktaları etiket yönetimini programatik biçimde ele alır; Google'ın Workspace yönetici yardım merkezi bu API'nin OAuth 2.0 kapsam gereksinimlerini ve kota sınırlarını ayrıntılı olarak belgelemektedir.
Üçüncü taraf otomasyon araçları (Zapier, Make, n8n) API entegrasyonu için kod yazmadan yapılandırma imkânı sunar. Ancak 6698 sayılı KVKK'nın 12. maddesi, kişisel veri içeren e-postaların işlenmesi sırasında teknik ve idari güvenlik tedbirlerinin alınmasını zorunlu kılmaktadır; dolayısıyla üçüncü taraf araç seçiminde veri işleme sözleşmesi (VİS) imzalanmış olması şarttır.
Aşağıdaki adımlar, Microsoft 365 kullanan orta ölçekli bir işletme için temel bir sınıflandırma altyapısının nasıl hayata geçirileceğini göstermektedir:
Otomatik sınıflandırma sistemleri, e-posta başlıklarını ve gövdelerini işlediğinden veri güvenliği doğrudan gündeme girer. RFC 5321 standardına göre SMTP sunucuları iletim sırasında TLS şifrelemesi kullanmalıdır; sınıflandırma altyapınızın bu iletişim kanallarına entegre olurken şifreli bağlantıları koruması zorunludur. E-posta içeriğinin sınıflandırma amacıyla işlenip işlenmeyeceği ve ne kadar süre saklanacağı, KVKK'nın 5. ve 7. maddeleri çerçevesinde aydınlatma metni ve veri saklama politikasında açıkça belirtilmelidir.
Sektörel uyumluluk gereksinimlerine sahip kuruluşlar (finans, sağlık) için sınıflandırma kararlarının denetim izi (audit trail) tutulması kritiktir. BDDK'nın Bilgi Sistemleri Yönetimi Tebliği kapsamındaki finans kuruluşları, e-posta arşivleme ve erişim denetimi konusunda ek yükümlülüklerle karşılaşabilir.
Sınıflandırma sisteminin etkinliğini ölçmek için doğruluk (accuracy), hassasiyet (precision), geri çağırma (recall) ve F1 skoru birlikte değerlendirilmelidir. Yalnızca genel doğruluğa bakılması yanıltıcı olabilir; nadir ama kritik kategorilerde (örneğin yasal bildirimler) yüksek geri çağırma oranı hedeflenmelidir. Kullanıcı geri bildirimi mekanizması kurarak yanlış sınıflandırılan iletilerin ekip tarafından işaretlenmesi, modeli pasif şekilde iyileştiren bir öğrenme döngüsü oluşturur. Bu yaklaşım, Gmail öncelikli gelen kutusu özelliğinde kullanılan "kullanıcı onaylı etiket" geri bildirim döngüsüne benzer bir prensibe dayanmaktadır.
İkisi birbirini tamamlar. Kural tabanlı sistemler öngörülebilir, denetlenebilir ve hızlıdır; özellikle yasal uyumluluk gerektiren kategoriler için tercih edilir. Yapay zeka tabanlı sistemler ise kural yazmanın güç olduğu, değişken içerikli ve büyük hacimli trafik için uygundur. En iyi sonuç, kural katmanı ile istatistiksel sınıflandırıcı kombinasyonuyla elde edilir.
Sieve, RFC 5228 ile standartlaştırılmış olup Dovecot, Cyrus IMAP, Kolab ve pek çok açık kaynak IMAP sunucusunda desteklenir. Microsoft Exchange ve Google Workspace, yerel Sieve desteği sunmaz; bu platformlarda kural yönetimi kendi yönetim arayüzleri üzerinden gerçekleştirilir.
6698 sayılı KVKK'nın 5. maddesi, kişisel veri işlemenin meşru bir dayanağı olmasını şart koşar; iş e-postaları için meşru menfaat veya sözleşme ifası gerekçesi genellikle geçerlidir. Önemli olan, aydınlatma yükümlülüğünün yerine getirilmesi ve verilerin yalnızca işleme amacı süresince saklanmasıdır.
Günlük 1.000–5.000 iletiye kadar iyi yapılandırılmış kural tabanlı filtreler yüksek doğrulukla çalışabilir. Bu eşiğin üzerinde veya kategori çeşitliliği onu geçtiğinde makine öğrenimi katmanı eklenmesi ölçeklenebilirlik açısından önerilir.
Düşük güven skorlu tahminleri otomatik olarak "İnceleme Bekleyen" klasörüne alın ve bu örnekleri manuel etiketleyerek modeli yeniden eğitin. Eşik değerini (threshold) kategoriye göre ayrı ayrı ayarlamak, kritik kategorilerde hata oranını önemli ölçüde düşürür.
Microsoft Graph API üzerinden mailboxSettings ve messageRules uç noktaları veya webhook abonelikleri kullanılabilir. OAuth 2.0 ile uygulama izinleri (Mail.ReadWrite) alındıktan sonra gelen her iletiyi harici bir sınıflandırma servisine yönlendirip sonucu Graph API aracılığıyla etikete dönüştürmek standart yaklaşımdır.
Geleneksel algoritmalar (Naive Bayes, SVM) için kategori başına 100–300 etiketlenmiş örnek başlangıç için yeterlidir. Transformer tabanlı modellerde (BERT, DistilBERT) kategori başına 50–100 örnek fine-tuning için makul bir başlangıç noktasıdır; verinin kalitesi miktardan daha belirleyicidir.
Çoğu modern CRM (Salesforce, HubSpot, Freshdesk), gelen e-posta etkinleştiriciler (email triggers) veya webhook uç noktaları sunar. Sınıflandırma sisteminin "Müşteri Talebi" olarak etiketlediği iletiler, bu webhook'lar aracılığıyla otomatik olarak destek bileti oluşturabilir, ilgili müşteri kaydına eklenebilir veya sorumlu ekibe yönlendirilebilir.
Kurumsal e-posta sistemlerinde işverenin çalışan e-postalarını işlemesi, genellikle iş sözleşmesi ve şirket politikasına dayandığı için yasal zemine oturur. Bununla birlikte çalışanların bilgilendirilmesi, 6698 sayılı KVKK'nın 10. maddesi çerçevesinde aydınlatma yükümlülüğünün yerine getirilmesi anlamına gelir ve kurumsal şeffaflık açısından önerilir.
rspamd (kural ve sinir ağı hibrit), Apache SpamAssassin (kural tabanlı), Dovecot ve Sieve (IMAP sunucu taraflı filtre) ile Python'da scikit-learn ücretsiz ve yaygın olarak belgelenmiş başlangıç araçlarıdır. Daha gelişmiş senaryolar için Hugging Face üzerindeki çok dilli metin sınıflandırma modelleri (örneğin xlm-roberta-base) Türkçe e-posta içeriğinde iyi sonuç verir.
Reklamsız, KVKK uyumlu; kurulum ve geçiş ücretsiz, mailleri biz taşırız.