Tuir Vladimir Vapnik (1995) Machine Learning tenke komprende liu husi teoria statistical learning theory, iha nebe nia objetivu prinsipal laos deit atu adapta data training, maibe mos atu hetan abilidade atu jeneraliza dadus foun nebe diak liu. Vladimir Vapnik hatete oinsa importante prinsipio structural risk minimization, nebe limita komplesidade modelu hodi evita overfitting.
Machine Learning (ML) mak ramu ida husi Artificial Intelligence (AI) ne'ebé permite sistema komputadór atu aprende husi dadus lahó presiza programa ho regra sira ne'ebé esklísitu ka fixu. Tuir Arthur Samuel, Machine Learning mak kampu estudu ida ne'ebé fó kapasidade ba komputadór atu aprende lahó programa direta. Iha kontestu deteksaun email spam, machine learning permite sistema atu: estuda padraun husi email spam no laos spam, identifika karakterístika husi spam, no halo prediksaun ba email foun sira.
Jeralmente, Machine Learning servisu liuhusi prosesu sira tuirmai ne'e: rekolla dadus, hamoos no foka ba prosesamentu dadus, troka dadus ba kategoria númeriku (features), treina modelu, testa modelu, no uza modelu ba prediksaun. Iha deteksaun spam, dadus ne'ebé uza mak kunteúdu testu husi email.
Supervised Learning: Métodu ida ne'ebé treina modelu uza dadus ne'ebé iha ona label. Ezemplu: Email A → Spam, Email B → Laos Spam. Modelu aprende husi dadus ne'e atu halo prediksaun ba email foun. Deteksaun email spam tama iha kategoria ne'e tanba uza dadus ne'ebé identifika ona.
Unsupervised Learning: Métodu ne'e la uza label. Modelu koko atu buka padraun ka grupu iha dadus laran ho automátiku. Ezemplu: Grupa email sira bazeia ba semellansa kunteúdu.
Reinforcement Learning: Modelu aprende bazeia ba sistema reward no punishment. Métodu ne'e ladún uza ba deteksaun spam.
Deteksaun spam mak kestaun problema klasifikasaun. Klasifikasaun mak prosesu atu foti prediksaun kategoria husi dadus ruma. Iha kazu ne'e: Input mak Email no Output mak Spam ka Laos Spam. Tanba iha de'it klase rua, ida-ne'e bolu nu'udar Binary Classification.
Iha Machine Learning, dataset baibain fahe ba Training Data (80%) atu treina modelu no Testing Data (20%) atu testa modelu. Objetivu mak atu modelu ne'e bele hetan teste iha dadus ne'ebé nia seidauk haree antes.
Deteksaun Email Spam mak sistema automátiku ida ne'ebé klasifika email sira ba kategoria spam ka laós spam (ham). Métodu tradisionál uza regra sira ne'ebé fixu (estatiku), maibé métodu modernu uza Machine Learning (aprendizajen mákina) atu aprende husi dadus no rekonhese padraun spam ho loloos no akuradu liután. Sistema ne'e importante tebes atu garante seguransa no konfortu ba utilizadór email sira iha mundu dijitál.
Aprende teknologia iha seguransa email global
Komprende logika probabilidade nebe uza hodi kompara email spam no email la spam
Oinsa makina halo tuir ema nia nia kakutak hodi konhese pola spam nebe avansadu
Simulasuna etapa hodi kria sistema spam ho dataset real