Dallimi midis minierave të të dhënave dhe ruajtjes së të dhënave

Dallimi midis minierave të të dhënave dhe ruajtjes së të dhënave
Dallimi midis minierave të të dhënave dhe ruajtjes së të dhënave

Video: Dallimi midis minierave të të dhënave dhe ruajtjes së të dhënave

Video: Dallimi midis minierave të të dhënave dhe ruajtjes së të dhënave
Video: LA NOUVELLE CARTE POKEMON de BULBIZARRE!!😍 2024, Korrik
Anonim

Nxjerrja e të dhënave kundrejt ruajtjes së të dhënave

Nxjerrja e të dhënave dhe ruajtja e të dhënave janë teknika shumë të fuqishme dhe të njohura për analizimin e të dhënave. Përdoruesit që janë të prirur drejt statistikave përdorin Data Mining. Ata përdorin modele statistikore për të kërkuar modele të fshehura në të dhëna. Minatorët e të dhënave janë të interesuar të gjejnë marrëdhënie të dobishme midis elementëve të ndryshëm të të dhënave, gjë që në fund të fundit është fitimprurëse për bizneset. Por nga ana tjetër, ekspertët e të dhënave që mund të analizojnë drejtpërdrejt dimensionet e biznesit priren të përdorin magazinat e të dhënave.

Nxjerrja e të dhënave njihet gjithashtu si Zbulimi i njohurive në të dhëna (KDD). Siç u përmend më lart, është një fushë e shkencës kompjuterike, e cila merret me nxjerrjen e informacionit të panjohur më parë dhe interesant nga të dhënat e papërpunuara. Për shkak të rritjes eksponenciale të të dhënave, veçanërisht në fusha të tilla si biznesi, nxjerrja e të dhënave është bërë një mjet shumë i rëndësishëm për të kthyer këtë pasuri të madhe të të dhënave në inteligjencë biznesi, pasi nxjerrja manuale e modeleve është bërë në dukje e pamundur në dekadat e fundit. Për shembull, aktualisht përdoret për aplikacione të ndryshme si analiza e rrjeteve sociale, zbulimi i mashtrimit dhe marketingu. Minimi i të dhënave zakonisht merret me katër detyrat e mëposhtme: grupimin, klasifikimin, regresionin dhe shoqërimin. Grumbullimi është identifikimi i grupeve të ngjashme nga të dhënat e pastrukturuara. Klasifikimi është rregulla e të mësuarit që mund të zbatohet për të dhënat e reja dhe zakonisht do të përfshijë hapat e mëposhtëm: përpunimin paraprak të të dhënave, dizajnimin e modelimit, mësimin/përzgjedhjen e veçorive dhe Vlerësimin/Verifikimin. Regresioni është gjetja e funksioneve me gabim minimal në modelimin e të dhënave. Dhe shoqata është në kërkim të marrëdhënieve midis variablave. Minierat e të dhënave zakonisht përdoren për t'iu përgjigjur pyetjeve të tilla si cilat janë produktet kryesore që mund të ndihmojnë për të marrë fitim të lartë vitin e ardhshëm në Wal-Mart?

Siç u përmend më lart, ruajtja e të dhënave përdoret gjithashtu për analizimin e të dhënave, por nga grupe të ndryshme përdoruesish dhe një qëllim paksa i ndryshëm në mendje. Për shembull, kur bëhet fjalë për sektorin e shitjes me pakicë, përdoruesit e magazinimit të të dhënave janë më të shqetësuar se cilat lloje blerjesh janë të njohura midis klientëve, kështu që rezultatet e analizës mund të ndihmojnë klientin duke përmirësuar përvojën e klientit. Por minatorët e të dhënave fillimisht hamendësojnë një hipotezë të tillë si klientët që blejnë një lloj produkti dhe analizojnë të dhënat për të testuar hipotezën. Magazinimi i të dhënave mund të kryhet nga një shitës me pakicë i madh, i cili fillimisht rezervon dyqanet e tij me të njëjtat madhësi produktesh për të zbuluar më vonë se dyqanet e Nju Jorkut shesin inventar me madhësi më të vogël shumë më shpejt se në dyqanet e Çikagos. Pra, duke parë këtë rezultat, shitësi me pakicë mund të rezervojë dyqanin e Nju Jorkut me madhësi më të vogla në krahasim me dyqanet e Çikagos.

Pra, siç mund ta shihni qartë, këto dy lloje analizash duket se janë të së njëjtës natyrë me sy të lirë. Të dy shqetësohen për rritjen e fitimeve bazuar në të dhënat historike. Por sigurisht, ka dallime kryesore. Me fjalë të thjeshta, Data Mining dhe Data Warehousing janë të dedikuara për pajisjen e llojeve të ndryshme të analizave, por patjetër për lloje të ndryshme përdoruesish. Me fjalë të tjera, Data Mining kërkon korrelacione, modele për të mbështetur një hipotezë statistikore. Por, Magazinimi i të Dhënave i përgjigjet një pyetjeje relativisht më të gjerë dhe i copëton dhe i zbërthen të dhënat nga atje e tutje për të njohur mënyrat e përmirësimit në të ardhmen.

Recommended: