Crib despre erorile statistice și corectitudinea algoritmilor

Distribuiți postul „patutul despre erorile statistice și acuratețea algoritmilor.“

Cel mai important lucru în statistici - este să știi cum te înșeli. Prin urmare, există mai multe moduri diferite de a calcula eroarea algoritmului pentru a înțelege exact cum ai crezut ceea ce ai gândit și ce ești cu adevărat. În acest post, am scris despre paradoxul Simpson, de tip I și erorile de tip II, precizia și puterea de algoritmi.







Pentru că orice lucru poate fi spus așa și așa să spună oamenilor să înțeleagă, vom considera un exemplu interesant (sau chiar pentru că exemplele de boli și diagnostice mi-a luat bine).

Ținta în Statele Unite, este ca banda noastră. Pe baza analizei datelor (un volum foarte mare), ei recomanda produse, reduceri trimiterea de poștă (SUA, amintiți-vă!). Și există un tată a fost surprins de faptul că fiica mea vine de la țintă cu un catalog, și există reduceri la produsele pentru gravide ... în general, a venit să-i țipe ... Și au cerut să înceapă testul făcut. În general, schimbarea preferințelor în achiziționarea, au avut cele mai multe fete au învățat că este timpul pentru a participa la cărucior.

În acest caz, am tastat se potrivesc cu situația reală și predicții. Aceasta se numește True opțiune pozitivă.

În cazul în care o fată cumpărat de pe cardul dvs. personal (sau card de credit, în funcție de modul atașat la Target'e informații) lucruri pentru prietena lui insarcinata, iar ea ar fi fost trimise după acel director, atunci algoritmul ar fi o greșeală a primului tip (fals pozitive soluție).







Dacă directorul pentru gravide ea nu a fost trimisă prin analiza achiziția sa, ar fi o eroare de ordinul a doua (opțiune de rezultate fals negative). În explicația clasică a subiectului, spune întotdeauna că fals negative - este probabil considerată o persoană bolnavă sănătoasă, atunci când a construi ipoteze.

Ei bine, aceasta rămâne o opțiune, atunci când ea nu este gravidă și ea nu a trimis catalog - algoritmul corect manipulate și nimic nu sa întâmplat. Aceasta opțiune Negativ Adevărat.

Nivelul semnificației și puterea testului (sau algoritm)

Care este eroarea statistică

Probabilitatea de eroare a primului tip este numit nivelul de semnificație. De regulă, acest nivel și sunt ghidate, alegând algoritmi pentru a testa ipoteze în statistici. Reprezintă probabilitatea de a respinge ipoteza că este de fapt adevărat (în imaginea din stânga - valorile corecte)

Probabilitatea de eroare de al doilea tip - este probabilitatea de a accepta ipoteza atunci când aceasta nu este de fapt adevărat. Dar de la sine nu este necesară probabilitatea de al doilea tip de eroare pentru oricine, iar valoarea dorită 1 - această probabilitate. Aceasta este - puterea testului. Acesta arată cât de bine algoritmul separă încheierea ipotezei, atunci când clase sunt foarte asemănătoare.

În exemplul nostru, îmbunătățirea sensibilității algoritmului va conduce la un risc crescut de eroare de tip I (alarmă falsă, fals pozitive), și scăderea sensibilității - crește riscul de erori de tip II (fals negativ, sărind peste acei oameni care pot oferi reduceri la produsele pe care le pot fi interes).

ROC-curba, erorile de curbă

Valoarea erorii primului tip sau al doilea tip nu oferă informații cu privire la cât de bine un algoritm ca un întreg. există o valoare mare pentru a înțelege cât de bine un algoritm sau criteriu, - ROC-curba. Se afișează imediat și proporția claselor recunoscute în mod corect și împărtășesc ipoteze respinse în mod eronat. În acest caz, numărul de top aici - ASC - aria de sub curbă. Ceea ce este mai mult, mai bine, în care 0,5 corespunde o presupunere simplu, și 1 - 100% predictii corecte.

Distribuiți postul „patutul despre erorile statistice și acuratețea algoritmilor.“