Varianca vs Kovarianca
Varianca dhe kovarianca janë dy masa që përdoren në statistika. Varianca është një masë e shpërndarjes së të dhënave, dhe kovarianca tregon shkallën e ndryshimit të dy variablave të rastësishëm së bashku. Varianca është më tepër një koncept intuitiv, por kovarianca përkufizohet matematikisht në fillim jo aq intuitiv.
Më shumë rreth Variance
Varianca është një masë e shpërndarjes së të dhënave nga vlera mesatare e shpërndarjes. Ai tregon se sa larg qëndrojnë pikat e të dhënave nga mesatarja e shpërndarjes. Është një nga përshkruesit kryesorë të shpërndarjes së probabilitetit dhe një nga momentet e shpërndarjes. Gjithashtu, varianca është një parametër i popullatës, dhe varianca e një kampioni nga popullata vepron si një vlerësues për variancën e popullatës. Nga një këndvështrim, ai përkufizohet si katrori i devijimit standard.
Në gjuhë të thjeshtë, mund të përshkruhet si mesatarja e katrorëve të distancës ndërmjet secilës pikë të dhënash dhe mesatares së shpërndarjes. Formula e mëposhtme përdoret për të llogaritur variancën.
Var(X)=E[(X-µ)2] për një popullsi dhe
Var(X)=E[(X-‾x)2] për një mostër
Mund të thjeshtohet më tej për të dhënë Var(X)=E[X2]-(E[X])2.
Variance ka disa veçori nënshkrimi dhe shpesh përdoret në statistika për ta bërë përdorimin më të thjeshtë. Varianca është jonegative sepse është katrori i distancave. Megjithatë, diapazoni i variancës nuk është i kufizuar dhe varet nga shpërndarja e veçantë. Varianca e një ndryshoreje të rastësishme konstante është zero, dhe varianca nuk ndryshon në lidhje me një parametër vendndodhjeje.
Më shumë rreth Kovariancës
Në teorinë statistikore, kovarianca është një masë se sa ndryshojnë dy variabla të rastësishëm së bashku. Me fjalë të tjera, kovarianca është një masë e fuqisë së korrelacionit midis dy ndryshoreve të rastit. Gjithashtu, mund të konsiderohet si një përgjithësim i konceptit të variancës së dy variablave të rastit.
Kovarianca e dy ndryshoreve të rastësishme X dhe Y, të cilat shpërndahen së bashku me momentin e dytë të fundëm, njihet si σXY=E[(X-E[X])(Y-E[Y])]. Nga kjo, varianca mund të shihet si një rast i veçantë i kovariancës, ku dy ndryshore janë të njëjta. Cov(X, X)=Var(X)
Me normalizimin e kovariancës, mund të merret koeficienti i korrelacionit linear ose koeficienti i korrelacionit të Pearson, i cili përcaktohet si ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Grafikisht, kovarianca ndërmjet një çifti pikash të dhënash mund të shihet si zona e drejtkëndëshit me pikat e të dhënave në kulmet e kundërta. Mund të interpretohet si një masë e madhësisë së ndarjes midis dy pikave të të dhënave. Duke marrë parasysh drejtkëndëshat për të gjithë popullsinë, mbivendosja e drejtkëndëshave që korrespondojnë me të gjitha pikat e të dhënave mund të konsiderohet si forca e ndarjes; varianca e dy variablave. Kovarianca është në dy dimensione, për shkak të dy ndryshoreve, por thjeshtimi i saj në një ndryshore jep variancën e një të vetme si ndarje në një dimension.
Cili është ndryshimi midis Variancës dhe Kovariancës?
• Varianca është masa e përhapjes/dispersionit në një popullatë ndërsa kovarianca konsiderohet si një masë e variacionit të dy ndryshoreve të rastësishme ose fuqia e korrelacionit.
• Varianca mund të konsiderohet si një rast i veçantë i kovariancës.
• Varianca dhe kovarianca varen nga madhësia e vlerave të të dhënave dhe nuk mund të krahasohen; prandaj ato janë normalizuar. Kovarianca normalizohet në koeficientin e korrelacionit (duke pjesëtuar me produktin e devijimeve standarde të dy variablave të rastit) dhe varianca normalizohet në devijimin standard (duke marrë rrënjën katrore)