Filtrování zpráv

Filtrování zpráv je proces zpracování e-mailových zpráv za účelem jejich organizace dle zadaných kritérií. Nejčastěji se jedná o automatické zpracování příchozích zpráv, ale termín se vztahuje i na zákrok člověka spolu s anti-spamovými technikami stejně jako na odchozí e-maily.

Vstupem softwaru pro filtrování zpráv je e-mail. Software poté buď doručí zprávu do uživatelovy schránky nezměněnou, přesměruje zprávu na jiné místo nebo dokonce e-mail zahodí. Některé filtry jsou schopny během zpracování zprávu i upravit.

Historie filtrování

Počátky ručního filtrování

Na počátku e-mailové komunikace bylo filtrování zpráv především manuálním procesem. Uživatelé vytvářeli složky a ručně přesouvali e-maily podle odesílatele, předmětu nebo obsahu zprávy. První e-mailoví klienti, jako Eudora nebo Lotus Notes, nabízeli pouze základní funkcionality pro organizaci pošty, ale neumožňovali automatické třídění v rámci procesu.[1][2]

Automatizace a algoritmy

S rapidním nárůstem objemu elektronické pošty a rozvojem internetu se objevila potřeba efektivnějších nástrojů pro organizaci a filtraci zpráv. V 90. letech byly vyvinuty první filtrační systémy, které pracovaly na základě jednoduchých pravidel, jako je blokování zpráv od konkrétních odesílatelů nebo identifikace klíčových slov. Tato pravidla umožnila základní automatické třídění e-mailů a filtrování spamu, kde i přesto byla omezena svou statickou povahou.[3]

Využití strojového učení

V roce 1998 došlo k posunu ve filtraci spamu pomocí bayesovskému modelu, který představili Sahami a jeho tým.[4] Tento model uplatnil pravděpodobnostní analýzu obsahu e-mailů a prokázal vysokou účinnost v automatickém třídění zpráv. Jeho úspěch inspiroval další výzkum a rozvoj pokročilých algoritmů a technologií zaměřených na zlepšení klasifikace e-mailů.[3]

V následujících letech byly vyvinuty pokročilejší algoritmy, jako jsou Support Vector Machines (SVM)[5] a neuronové sítě, které umožnily přesnější klasifikaci e-mailů. Tyto technologie se staly základem moderních e-mailových klientů a služeb, které dnes využívají pokročilé techniky strojového učení pro automatické třídění, dále detekci spamu a phishingu.[3]

Důvod filtrování zpráv

Obvyklé využití e-mailových filtrů spočívá v organizaci příchozích e-mailů a odstraňování spamů a počítačových virů. Občas se využívá i k vyšetřování odchozích e-mailů v některých společnostech, aby bylo zajištěno, že zaměstnanci splňují příslušné povinnosti. Uživatelé mohou také využít e-mailového filtru pro upřednostnění zpráv a zařazení zpráv do složek podle předmětu nebo jiných kritérií.

Zde jsou uvedeny výhody a nevýhody filtrování zpráv, které mohou tento proces zlepšit nebo ovlivnit a přinést určité výzvy:

Úspora času a zlepšení organizace

  • Filtrování zpráv přináší efektivní organizaci doručené pošty a šetří uživatelům jejich čas. Filtry a štítky zajišťují, že důležité e-maily jsou okamžitě přístupné bez provedení manuálního vyhledávání.[6][7]

Snížení rizika ztráty důležitých zpráv

  • Filtrování zpráv napomáhá snižovat riziko, že by uživatel mohl přehlédnout důležité zprávy, které jsou tříděny jako hlavní.[6][7]

Možnost nesprávného zařazení

  • Existuje riziko, že významné zprávy mohou být omylem zařazeny mezi spam nebo do nesprávné složky, což může vést k jejich vynechání.[6][7]

Náročnost na správu pravidel a modelů

  • Správa pravidel může být pro uživatele složitá, zejména pokud mají nastaveno více filtrů. Kromě toho mohou algoritmy strojového učení požadovat velké množství tréninkových dat a pravidelnou údržbu.[6][7]

Metody a e-mailoví klienti

E-mailové filtry mohou být nainstalovány uživatelem buď jako oddělené programy nebo jako část jejich e-mailových klientů. V e-mailových klientech si mohou uživatelé „ručně“ vytvořit filtry, které potom automaticky filtrují zprávy dle zadaných kritérií. Většina e-mailových klientů má také automatický spamový filtr. Poskytovatelé internetového připojení mohou také mít nainstalované e-mailové filtry v jejich programech pro přenos e-mailů jako službu pro všechny své zákazníky. Vzhledem k rostoucímu počtu podvodných webových sítí poskytovatelé filtrují URL v e-mailových zprávách k odstranění nebezpečných odkazů dříve, než na ně uživatelé kliknou. Společnosti často používají filtry, aby ochránili zaměstnance a jejich informační technologie.

Mezi nejznámější e-mailové klienty a služby, které automatické třídění nabízejí, patří:

  • Microsoft Outlook: Umožňuje vytváření pravidel pro automatický přesun zpráv do určených složek na základě kritérií, jako je odesílatel, předmět nebo klíčová slova.[8]
  • Gmail: Nabízí filtry a štítky pro uspořádání e-mailů, včetně automatického třídění zpráv do kategorií, jako jsou Primární, Sociální a Promo akce.[9][10]
  • Yahoo Mail: Poskytuje možnost nastavení filtrů pro automatické třídění zpráv do konkrétních složek na základě nastavených pravidel.[11][12]
  • Apple Mail: Podporuje vytváření pravidel pro automatické zpracování a třídění příchozích e-mailů do složek nebo jejich označování pomocí štítků.[13]
  • Email.cz: Poskytuje možnost nastavení filtrů pro automatické třídění zpráv do konkrétních složek na základě nastavených pravidel.[14]

Příchozí a odchozí filtrování

E-mailové filtry mohou zpracovávat příchozí a odchozí e-mailový provoz. Filtrování příchozích e-mailů zahrnuje prověřování zpráv z internetu adresovaných chráněným uživatelům nebo legální ukládání dat za účelem analýzy či evidence. Filtrování odchozích e-mailů zahrnuje opak – prozkoumávání e-mailových zpráv lokálních uživatelů předtím, než mohou být potenciálně škodlivé zprávy odeslaný ostatním uživatelům internetu. [15] Jedna z metod filtrování odchozích e-mailů běžně používána poskytovately internetu je Transparent SMTP proxy, ve které je e-mailový provoz zadržen a filtrován skrze transparentní proxy uvnitř sítě. Odchozí filtrování má také uplatnění na e-mailovém serveru. Mnoho společností používá technologii pro prevenci úniku dat v jejich e-mailových serverech pro odchozí poštu k předejití úniku citlivých informací skrze e-mail.

Úprava dle požadavků

E-mailové filtry mají různé stupně konfigurovatelnosti. Někdy se rozhodují na základě regulárních výrazů. V jiných případech jsou používána klíčová slova v těle zprávy nebo třeba e-mailové adresy odesílatele zprávy. Některé pokročilejší filtry, částečně anti-spamové filtry, používají techniky pro statistické klasifikace dokumentů jako např. naivní bayesovský klasifikátor. Může být použito i filtrování obrázků, které používá algoritmy komplexní analýzy obrázků pro detekování odstínů pleti a specifických částí těla asociovaných s obrázky pro dospělé (pornografické obrázky).

Související články

Reference

V tomto článku byl použit překlad textu z článku Email filtering na anglické Wikipedii.

  1. Eudora History: Email for a Different Era. Tedium: The Dull Side of the Internet. [online]. 2017-09-28 [cit. 2024-12-14]. Dostupné online. (anglicky) 
  2. The History of Notes and Domino [online]. NotesMail, 2005-12-20 [cit. 2024-12-14]. Dostupné online. 
  3. a b c DADA, E. G. Machine learning for email spam filtering: review, approaches and open research problems [online]. Elsevier, 2019 [cit. 2024-12-14]. Dostupné online. 
  4. MEHRAN, DUMAIS, HECKERMAN, HORVITZ, Sahami, Susan, David, Eric. A Bayesian Approach to Filtering Junk E-Mail [online]. ResearchGate, 1998 [cit. 2024-12-14]. Dostupné online. 
  5. ALEISA, Mohammed A.; ALSUWIT, Meaad Hamad; HAQ, Mohd Anul. Advancing Email Spam Classification using Machine Learning and Deep Learning Techniques [online]. Scopus, 2024-08 [cit. 2024-12-14]. Dostupné online. 
  6. a b c d MATVEEVA, Irene. Pros and Cons of Email Automation for Customer-Facing Teams [online]. Medium, 2022-12-28 [cit. 2024-12-14]. Dostupné online. 
  7. a b c d Tech Advancements in Email Sorting. www.trimbox.io [online]. [cit. 2024-12-14]. Dostupné online. (anglicky) 
  8. Manage email messages by using rules in Outlook - Microsoft Support. support.microsoft.com [online]. [cit. 2024-12-14]. Dostupné online. 
  9. Create rules to filter your emails. Google Support [online]. Google [cit. 2024-12-14]. Dostupné online. 
  10. How To Filter Emails In Yahoo: A Step-by-step Guide For 2024. clean.email [online]. [cit. 2024-12-15]. Dostupné online. (anglicky) 
  11. Use filters to organize Yahoo Mail | Yahoo Help - SLN28071. help.yahoo.com [online]. [cit. 2024-12-14]. Dostupné online. 
  12. How to Run Filter Rules in Yahoo Mail to Prevent Inbox Overload. clean.email [online]. [cit. 2025-01-05]. Dostupné online. (anglicky) 
  13. Správa příchozích e‑mailů v Mailu na Macu pomocí pravidel. Apple Support [online]. [cit. 2024-12-14]. Dostupné online. 
  14. Práce se zprávami. Nápověda Email.cz [online]. [cit. 2025-01-23]. Dostupné online. 
  15. ZONK. How Pervasive is ISP Outbound Email Filtering? [online]. Slashdot.org [cit. 2011-09-15]. Dostupné online.