Analiza statistician primare
Pentru a determina cât de matematică și de prelucrare statistică, este mai întâi necesar să se evalueze natura distribuirii tuturor parametrilor utilizați. Pentru parametrii având o distribuție normală sau aproape de normal, este posibil să se utilizeze metodele statisticii parametrice, care, în multe cazuri, sunt mai puternice decât metodele de statistici non-parametrice. Avantajul este că acesta din urmă le permit să verifice ipoteza statistică, indiferent de forma de distribuție.
Una dintre cele mai importante din statisticile matematice este acela al unei distribuții normale. Distribuția normală - model de variație a unei variabile aleatoare ale cărei valori sunt determinate prin care funcționează simultan o multitudine de factori independenți. Numărul de astfel de factori este mare, iar efectul fiecăreia dintre ele separat, este foarte mic. Acest caracter de influență reciprocă este foarte caracteristic fenomenelor mentale, astfel încât cercetătorul în domeniul psihologiei relevă adesea o distribuție normală. Cu toate acestea, acest lucru nu este întotdeauna astfel încât în fiecare caz, forma de distribuție ar trebui să fie verificată.
Cele mai importante statistici primare sunt:
a) media aritmetică - este valoarea sumei abaterilor pozitive și negative de la zero. În statisticile, aceasta notată cu litera M sau x. , Este necesar să se calculeze suma tuturor valorilor seriei și împărțiți suma de numărul de valori însumate. Dacă numărul este, numărul cu semnul „minus“, însumarea se face ținând cont de semnele.
b) deviația standard (notată cu litera grecească s (sigma), și, de asemenea, menționată ca principal, sau o deviație standard) - o măsură a diversității în grupul de obiecte; arată cât de mult media deviază în fiecare exemplu de realizare (valoarea specifică a parametrului estimat) din media aritmetică. Variațiile mai dispersate în raport cu media, cu atât mai mare este abaterea medie și standard de. Valorile de dispersie caracterizează magnitudinea - diferența dintre cea mai mare și cea mai mică valoare din serie. Cu toate acestea sigma caracterizează complet variația valorilor în raport cu media aritmetică.
c) Coeficientul de variație - raportul dintre media aritmetică pentru sigma, înmulțit cu 100%. CV-ul desemnat:
Sigma - valoarea pe nume și nu depinde numai de gradul de variație, dar, de asemenea, pe unități. Prin urmare, Sigma poate fi comparat doar variabilitatea acelorași indicatori, și pentru a compara diferitele caracteristici ale valorii absolute Sigma nu poate fi. Pentru a compara nivelul de semne de variabilitate orice dimensiune (exprimată în diferite unități de măsură) și pentru a evita influența scala de măsurare pe valoarea mediei aritmetice a sigma medie, se utilizează coeficientul de variație, care reprezintă o reducere a substanțial aceeași valoare scară s.
Pentru o distribuție normală sunt cunoscute relații cantitative precise și valorile de frecvență permit de a prezice apariția unor noi variante: 1) stânga și la dreapta de aritmetică este de 50% din modelul de realizare; 2) în intervalul M-1s la M + 1s - 68,7% realizare; 3) în intervalul M-1.96s M + 1.96s - versiunea 95%.
Astfel, concentrându-se pe caracteristicile de distribuție normală, este posibil să se evalueze gradul de proximitate a distribuției luate în considerare.
Următoarele sunt astfel de statistici primare în importanță ca și asimetria aplatizării. Coeficientul de asimetrie - un indicator al distribuției de asimetria la stânga sau la dreapta pe axa orizontală. În cazul în care piciorul drept este mai lung decât curba din stânga - vorbesc despre o asimetrie pozitivă, în caz contrar - pe negativ. indicele a atins punctul culminant aplatizării. Curbe, mai mari în partea sa centrală - a atins punctul culminant, numit excesiv, au o valoare mare de aplatizării. Atunci când reducerea cantității de exces curba devine mai plată, dobândind un platou, apoi șa - o deviere în porțiunea de mijloc.
Aceste opțiuni vă permit să facă prima idee a naturii distribuției: distribuția normală este rară de a detecta factorul de asimetrie aproape de unitate și mai multă unitate (-1 și +1).
Subliniez că aceasta este doar o estimare aproximativă. Evaluarea exactă și riguroasă a distribuției normale pot fi obținute folosind una din metodele de autentificare existente (a se vedea. De exemplu, capitolele 2 și 5 carte G.V.Suhodolskogo „Bazele statisticii matematice pentru psihologi“. ML 1972)
Începeți cu o analiză a statisticilor primare este necesară, de asemenea, pentru motivul că acestea sunt foarte sensibile la prezența opțiunii drop-down. Cantități mari de exces și asimetrie de multe ori un indicator de eroare în calculele manual sau de eroare la introducerea datelor prin intermediul tastaturii pentru prelucrarea pe calculator. Gafe la introducerea datelor în prelucrarea pot fi detectate prin compararea valorii sigma au parametri similari. Valoarea sigma eliberată poate indica o eroare.
Există o regulă că toate calculele ar trebui să fie efectuate manual de două ori (o responsabilitate specială - de trei ori), și este de dorit în multe feluri, cu o variație a secvenței de referință la o matrice numerică.
Ca parte a niciodată nu reușește să caracterizeze pe deplin întreg, există întotdeauna posibilitatea ca evaluarea populației generale pe baza datelor din eșantion nu este suficient de precisă, are o eroare mai mare sau mai mică. Astfel de erori reprezintă extrapolarea erorilor de generalizare asociată cu transferul rezultatelor obținute în probele de studiu pe întreaga populație, numită marjă de eroare. Reprezentativitatea - măsura în care parametrii generali ai indicatori selectați.
Marja de eroare statistică arată limitele în care parametrii se pot abate de la populația generală (de la așteptările sau valori reale) determinarea noastră privată obținută pe baza unor eșantioane specifice. Evident, valoarea de eroare este mai mare decât variația caracteristică și mai mare decât cea mai mică probă. Acest lucru se reflectă în formulele pentru a calcula erorile statistice ce caracterizează variația indicatorilor selectați în jurul parametrii lor generali.
Statisticile includ numărul de eroare statistică primară a mediei aritmetice. Formula de calcul sa este următoarea:
unde m - sem, s - sigma, n - numărul de valori de caracteristici. Acestea sunt statisticile primare de bază, care dau un sentiment de distribuire a datelor în matrice experimentală.