Dallimi kryesor – Mësimi i makinerisë i mbikëqyrur dhe i pambikëqyrur
Mësimi i mbikëqyrur dhe mësimi i pambikëqyrur janë dy koncepte thelbësore të mësimit të makinerive. Mësimi i mbikëqyrur është një detyrë e të mësuarit të makinës për të mësuar një funksion që harton një hyrje në një dalje bazuar në shembullin e çifteve hyrje-dalje. Mësimi i pambikëqyrur është detyra e Mësimit të Makinerisë për të nxjerrë një funksion për të përshkruar strukturën e fshehur nga të dhënat e paetiketuara. Dallimi kryesor midis mësimit të makinerive të mbikëqyrur dhe të pambikëqyrur është se mësimi i mbikëqyrur përdor të dhëna të etiketuara ndërsa mësimi i pambikëqyrur përdor të dhëna të paetiketuara.
Mësimi i Makinerisë është një fushë në Shkencën Kompjuterike që i jep mundësinë një sistemi kompjuterik të mësojë nga të dhënat pa u programuar në mënyrë eksplicite. Kjo ju lejon të analizoni të dhënat dhe të parashikoni modelet në to. Ka shumë aplikime të mësimit të makinerive. Disa prej tyre janë njohja e fytyrës, njohja e gjesteve dhe njohja e të folurit. Ekzistojnë algoritme të ndryshme që lidhen me mësimin e makinerive. Disa prej tyre janë regresioni, klasifikimi dhe grupimi. Gjuhët më të zakonshme të programimit për zhvillimin e aplikacioneve të bazuara në mësimin e makinerive janë R dhe Python. Mund të përdoren edhe gjuhë të tjera si Java, C++ dhe Matlab.
Çfarë është mësimi i mbikëqyrur?
Në sistemet e bazuara në mësimin e makinerive, modeli funksionon sipas një algoritmi. Në mësimin e mbikëqyrur, modeli mbikëqyret. Së pari, kërkohet të trajnohet modeli. Me njohuritë e fituara, ai mund të parashikojë përgjigje për rastet e ardhshme. Modeli është trajnuar duke përdorur një grup të dhënash të etiketuar. Kur sistemit i jepet një të dhënë nga mostra, ai mund të parashikojë rezultatin. Më poshtë është një ekstrakt i vogël nga grupi i të dhënave popullore IRIS.
Sipas tabelës së mësipërme, gjatësia e sepalit, gjerësia e sepalit, gjatësia e patelit, gjerësia e patelit dhe speciet quhen atribute. Kolonat njihen si tipare. Një rresht ka të dhëna për të gjitha atributet. Prandaj, një rresht quhet vëzhgim. Të dhënat mund të jenë ose numerike ose kategorike. Modelit i jepen vëzhgimet me emrin përkatës të specieve si hyrje. Kur jepet një vëzhgim i ri, modeli duhet të parashikojë llojin e specieve që i përket.
Në mësimin e mbikëqyrur, ekzistojnë algoritme për klasifikimin dhe regresionin. Klasifikimi është procesi i klasifikimit të të dhënave të etiketuara. Modeli krijoi kufij që ndanin kategoritë e të dhënave. Kur modelit i jepen të dhëna të reja, ai mund të kategorizohet në bazë të vendit ku ekziston pika. K-Neighbors më të afërt (KNN) është një model klasifikimi. Në varësi të vlerës k, vendoset kategoria. Për shembull, kur k është 5, nëse një pikë e caktuar e të dhënave është afër tetë pika të dhënash në kategorinë A dhe gjashtë pika të dhënash në kategorinë B, atëherë pika e të dhënave do të klasifikohet si A.
Regresioni është procesi i parashikimit të tendencës së të dhënave të mëparshme për të parashikuar rezultatin e të dhënave të reja. Në regresion, prodhimi mund të përbëhet nga një ose më shumë ndryshore të vazhdueshme. Parashikimi bëhet duke përdorur një linjë që mbulon shumicën e pikave të të dhënave. Modeli më i thjeshtë i regresionit është një regresion linear. Është i shpejtë dhe nuk kërkon parametra akordimi si në KNN. Nëse të dhënat tregojnë një prirje parabolike, atëherë modeli i regresionit linear nuk është i përshtatshëm.
Këta janë disa shembuj të algoritmeve të të mësuarit të mbikëqyrur. Në përgjithësi, rezultatet e gjeneruara nga metodat e të mësuarit të mbikqyrur janë më të sakta dhe më të besueshme sepse të dhënat hyrëse janë të njohura dhe të etiketuara mirë. Prandaj, makina duhet të analizojë vetëm modelet e fshehura.
Çfarë është të mësuarit pa mbikëqyrje?
Në mësimin e pambikëqyrur, modeli nuk mbikëqyret. Modeli punon më vete, për të parashikuar rezultatet. Ai përdor algoritme të mësimit të makinerive për të arritur në përfundime mbi të dhënat e paetiketuara. Në përgjithësi, algoritmet e mësimit të pambikëqyrur janë më të vështira se algoritmet e të mësuarit të mbikëqyrur sepse ka pak informacion. Grumbullimi është një lloj mësimi i pambikëqyrur. Mund të përdoret për të grupuar të dhënat e panjohura duke përdorur algoritme. Grumbullimi i mesatares k dhe i bazuar në densitet janë dy algoritme grupimi.
k-algoritmi mesatar, vendos k centroid në mënyrë të rastësishme për çdo grup. Pastaj secila pikë e të dhënave i caktohet qendrës më të afërt. Distanca Euklidiane përdoret për të llogaritur distancën nga pika e të dhënave në qendër. Pikat e të dhënave klasifikohen në grupe. Pozicionet për k centroidet llogariten përsëri. Pozicioni i ri i qendrës përcaktohet nga mesatarja e të gjitha pikave në grup. Përsëri, çdo pikë e të dhënave i caktohet qendrës më të afërt. Ky proces përsëritet derisa centroidet të mos ndryshojnë më. k-mean është një algoritëm i shpejtë i grupimit, por nuk ka inicializim të specifikuar të pikave të grupimit. Gjithashtu, ka një variacion të madh të modeleve të grupimit bazuar në inicializimin e pikave të grupimit.
Një tjetër algoritëm grupimi është grupimi i bazuar në densitet. Njihet gjithashtu si aplikacione të grumbullimit hapësinor të bazuar në densitet me zhurmë. Ai funksionon duke përcaktuar një grup si grupi maksimal i pikave të lidhura me densitet. Ato janë dy parametra të përdorur për grupimin e bazuar në densitet. Ato janë Ɛ (epsilon) dhe pikë minimale. Ɛ është rrezja maksimale e lagjes. Pikat minimale janë numri minimal i pikave në lagjen Ɛ për të përcaktuar një grup. Këta janë disa shembuj të grupimit që bie në mësimin e pambikëqyrur.
Në përgjithësi, rezultatet e gjeneruara nga algoritmet e mësimit të pambikëqyrur nuk janë shumë të sakta dhe të besueshme sepse makina duhet të përcaktojë dhe etiketojë të dhënat hyrëse përpara se të përcaktojë modelet dhe funksionet e fshehura.
Cila është ngjashmëria midis mësimit të makinerisë të mbikëqyrur dhe të pambikëqyrur?
Të mësuarit e mbikëqyrur dhe të pambikëqyrur janë lloje të mësimit të makinerisë
Cili është ndryshimi midis mësimit të makinerisë të mbikëqyrur dhe të pambikëqyrur?
Mësimi i makinerisë i mbikëqyrur kundrejt pa mbikëqyrje |
|
Mësimi i mbikëqyrur është detyra e Mësimit të Makinerisë për të mësuar një funksion që harton një hyrje në një dalje bazuar në çiftet e shembullit hyrje-dalje. | Mësimi i pambikëqyrur është detyra e Mësimit të Makinerisë për të nxjerrë një funksion për të përshkruar strukturën e fshehur nga të dhënat e paetiketuara. |
Funksionaliteti kryesor | |
Në mësimin e mbikëqyrur, modeli parashikon rezultatin bazuar në të dhënat hyrëse të etiketuara. | Në mësimin e pambikëqyrur, modeli parashikon rezultatin pa të dhëna të etiketuara duke identifikuar modelet më vete. |
Saktësia e rezultateve | |
Rezultatet e gjeneruara nga metodat e mësimit të mbikëqyrur janë më të sakta dhe më të besueshme. | Rezultatet e gjeneruara nga metodat e mësimit të pambikëqyrur nuk janë shumë të sakta dhe të besueshme. |
Algoritmet kryesore | |
Ka algoritme për regresionin dhe klasifikimin në mësimin e mbikëqyrur. | Ka algoritme për grupimin në mësimin e pambikëqyrur. |
Përmbledhje – Mësimi i makinerisë i mbikëqyrur dhe i pambikëqyrur
Mësimi i Mbikëqyrur dhe Mësimi i Pambikëqyrur janë dy lloje të Mësimit të Makinerisë. Mësimi i mbikëqyrur është detyra e Mësimit të Makinerisë për të mësuar një funksion që harton një hyrje në një dalje bazuar në çiftet e shembullit hyrje-dalje. Mësimi i pambikëqyrur është detyra e Mësimit të Makinerisë për të nxjerrë një funksion për të përshkruar strukturën e fshehur nga të dhënat e paetiketuara. Dallimi midis mësimit të makinerive të mbikëqyrur dhe të pambikëqyrur është se mësimi i mbikëqyrur përdor të dhëna të etiketuara ndërsa prirja e pambikëqyrur përdor të dhëna të paetiketuara.