Statistici pentru Dummies

conceptul intervalelor de încredere

Descrierea postului procesului de evaluare

Formula generală a intervalului de încredere

Interpretarea rezultatelor intervalului de încredere







Detectarea rezultate anormale

Bytes statistici ost este utilizat pentru a aproxima caracteristicile oricărei populații țintă, de exemplu, media

venitul familiei Nij, procentul de persoane care cumpără cadouri pentru Crăciun on-line, cantitatea medie de inghetata consumate anual în Statele Unite ale Americii (probabil, este mai bine să nu se afle). Aceste caracteristici sunt denumite colectiv parametri. De obicei, oamenii doresc să evalueze (de exemplu, presupunem), valoarea de a face o selecție din set și folosind statisticile din eșantion, ceea ce le va permite să facă o presupunere calitativă. Deci, ce este o „presupunere calitativă“?

Cea mai înaltă calitate ar fi lipsa completă de ipoteze - de exemplu, dacă ai determina să lucreze imediat și cu acuratețe a parametrilor. Dar, pentru a determina valoarea exactă a parametrului fără efectuarea unui recensământ al întregii populații, este imposibil - în cele mai multe cazuri, ar fi de lucru obositoare și costisitoare. Dar statisticile nu se tem de dificultăți, astfel încât ei spun adesea: „Pentru a fi un statistician - astfel încât să nu spun că ești încrezător. Principalul lucru - doar pentru a ajunge mai aproape de adevăr ". Desigur, statisticile vor să fie siguri că rezultatele sunt cât mai exacte posibil să reflecte realitatea, pentru că cercetările au fost cheltuiți bani și timp. Pentru a obține cele mai precise rezultate mult mai ușor decât crezi. În cazul în care procedeul este efectuat corect (și în mass-media nu se întâmplă de multe ori!), O estimare brută poate să reflecte cu acuratețe setarea. În acest capitol veți învăța pe scurt despre intervalele de încredere (de exemplu, specii suspectate de estimări care statisticienii utilizează și recomandă), cu privire la motivul pentru care au nevoie de a utiliza (spre deosebire de o singură ipoteză), cum să interpretați intervalul de încredere și este văzut la presupuneri eronate.

Nu toate ipotezele sunt

Deschide o revista sau un ziar, porniți la radio sau TV, și veți găsi o multitudine de date statistice, dintre care multe sunt tentativa de estimare a unei sume. S-ar putea fi întrebați despre modul în care acestea au fost obținute

Statistici pentru Dummies

indicatori. În unele cazuri, numerele au fost testate riguros, în altele - este doar o lovitură la întâmplare. Iată câteva exemple de ipoteze pe care am venit peste doar o camera revista de conducere pentru afaceri. Toate au venit din diferite surse.

26 de milioane de oameni, cel puțin o dată pe an pentru a juca golf.

6,7% din casele din SUA au fost achiziționate fără plată.

Deși astăzi nu este ușor pentru a obține un loc de muncă în unele zone de personal nou într-adevăr nevoie: pentru următorii opt ani va avea 13.000 de asistenți anestezisti. Salariu - de la 80 la 95 de mii de dolari pe an ..

În timpul sezonului, important jucător liga de baseball utilizează o medie de 90 de biți.

Lamborghini Murcielago masina accelereaza de la 0 la 60 mile pe oră în 3.7 secunde. Viteza maximă - aproximativ 205 mile pe oră.

Unele dintre aceste date pentru a obține mai ușor decât altele. Iată câteva observații pe care am putut face asta.

De unde știi că 26 de milioane de oameni, cel puțin o dată pe an pentru a juca golf? De fapt, pentru a afla că nu este atât de dificil, pentru că toți jucătorii de golf înainte de joc trebuie să completeze chestionarul. Deci, după examinarea chestionarele completate pot fi ipoteze calitative cu privire la cât de mulți oameni se joacă cel puțin o dată pe an. (Singura problemă - nu iau în considerare sunt cei care deja au luat în considerare înainte.)

Setați procentul de călători care au necesitat asistență medicală, sau case cumpărate fără plată, poate fi în studiu. În cazul în care sondajul cheltui în mod corect (a se vedea cap. 16), aceste date pot fi destul de exacte.

Cum pentru a afla câți asistenți anestezisti au nevoie pentru următorii opt ani? Puteți începe prin a afla cât de mulți specialiști în această perioadă se vor pensiona, dar nu ia în considerare dezvoltarea industriei. Faceți o presupunere poate fi destul de exacte, dar uita-te la viitor timp de opt ani, pentru unul sau doi ani - este mult mai dificilă sarcină.

Găsiți numărul mediu de biți, care sunt utilizate pentru sezonul majore liga de baseball, este posibil, intervievarea jucătorilor, persoanele responsabile de echipamentele lor, sau companii de livrare biți.

Se determină viteza autovehiculului este mai dificil, dar se poate face într-un experiment folosind un cronometru. În acest caz, trebuie să verificați mai multe mașini diferite (nu doar unul) din același model.

Statistici pentru Dummies

spațierea cuvintelor este folosit pentru că rezultatul este convertit în intervalul. De exemplu, să spunem, procentul de copii care place baseball-ul, este de 40%, plus / minus 3,5%. Aceasta înseamnă că procentul de copii cărora le place de baseball, este undeva intre 40% - 3,5% = 36,5% și 40% + 3,5% = 43,5%. Prin urmare, limita inferioară a intervalului - este o statistică minus marja de eroare, iar limita superioară - o măsură plus o marjă de eroare.

Cuvântul de încredere este utilizat pentru că sunteți într-un anumit grad de încredere în proces, în cursul căreia a primit acest interval. Aceasta se numește nivelul de încredere.

Formulele și exemple ale intervalelor de încredere cel mai frecvent utilizate, vezi capitolul 13.

Interpretarea rezultatelor Confident

Imaginează-ți că ești - un biolog și cercetător, încercarea de a prinde rețeaua manuală de pește, a cărei mărime corespunde lățimii intervalului dvs. de încredere. (Lățimea marja de eroare este înmulțită cu doi să se contabilizeze atât de adunare și scădere.)

Să presupunem că nivelul de încredere este de 95%. Ce înseamnă acest lucru? Acest lucru înseamnă că, dacă din nou și din nou să arunce plasa în apă, captura de 95% din peștele. Pescuitul în acest caz, înseamnă că intervalul de încredere dumneavoastră a fost corectă și a conținut parametrul adevărat (aici parametrul este reprezentat de pește).

Dar acest lucru nu înseamnă că aveți o șansă de 95%, pentru a prinde un pește dacă te arunci rețeaua doar o singură dată? Nu. Nu este clar? Cu siguranță. I explica: de exemplu, ați încerca doar să arunce rețea și să închideți ochii înainte să-l arunci în apă. În acest moment, aveți 95% din captura de pește. Dar trageți rețeaua sub apă, fără a deschide ochii - și veți avea doar două opțiuni: fie să prind un pește sau nu. Probabilitatea nu joacă un rol.







În mod similar, după ce datele au fost colectate, iar intervalul de încredere este calculat, fie să găsiți un adevărat parametru din populația totală sau nu. Deci, nu spui 95% sigur că parametrul este în acest interval, pentru că faci sau să-l găsesc sau nu. Ceea ce sunt 95% sigur - deci

în acest proces, în timpul căreia datele au fost colectate și a găsit un interval de încredere. Știi că intervalele care reflectă cu acuratețe valoarea medie de 95% va rezulta din acest proces. Restul de 5% din datele colectate în eșantion, sa întâmplat să aibă valori anormal de ridicate sau scăzute, prin urmare, nu reprezintă totalitatea. În astfel de cazuri, nu puteți găsi o opțiune.

Astfel, cu mărimea și structura rețelei dreapta, vă va prinde 95% din pește

pentru o perioadă de timp predeterminată. Dar, în timpul fiecare încercare de ai prinde vreodată un pește sau nu.

Nivel de încredere, dimensiunea eșantionului și variabilitatea agregatului - toate

Înainte de a lua decizii bazate pe evaluarea unei alte persoane, se procedează după cum urmează.

Aflați cum măsură statistică a fost obținută. Acesta trebuie să fie rezultatul unui proces științific prin care aduna date fiabile, obiective și exacte. (A se vedea. Capitolele 2 și 3)

Uita-te pentru o marjă de eroare. În cazul în care nu este specificat, găsiți sursa originală.

Capitolul 11. Estimări: Conceptul de intervale de încredere

Calcularea intervalelor de încredere exacte

În așteptare pentru un anumit nivel de încredere în rezultatele estimate

Metode generale pentru intervalul de încredere de calcul

Factorii care influențează lățimea intervalului de încredere

D intervalul overitelny - o statistică nume fantezie, cu care a comunicat, iar marja de eroare (informații generale despre confi-

În acest capitol veți învăța cum să calculeze propriul CI. Vei face cunoștință cu unele detalii ale intervalelor de încredere: ceea ce le face să aibă aceeași sau mai mare decât de ce poate fi mai mult sau mai puțin sigur de rezultatele obținute, precum și că acestea sunt măsurate, și că - nr. Cu aceste informații, veți ști ce să caute atunci când îndeplinesc rezultatele statistice, și va fi în măsură să determine cât de exacte sunt.

Calculul intervalului de încredere

Intervalul de încredere este de indicator statistic, plus / minus o marjă de eroare (vezi cap. 10). De exemplu, să presupunem că doriți să știți procentul de pickups tuturor vehiculelor din Statele Unite ale Americii (în acest caz, va fi parametrul). Este imposibil să se examineze toate masinile din SUA, astfel încât să faci un eșantion aleatoriu de 1.000 de vehicule pe diferite autostrăzi în diferite momente ale zilei. Ca urmare, este dezvăluit faptul că 7% dintre vehicule au fost selectate camionete. Dar nu se poate spune că exact 7% din toate masinile vor fi camionetele pe drumurile americane, deoarece este cunoscut faptul că acest rezultat se bazează pe toate mașinile selectate din 1000. Deși 7% - acest lucru este destul de aproape de cifra adevărată, este imposibil de a ști sigur, pentru că vă bazați rezultatele pe un eșantion și nu pe toate vehiculele din Statele Unite ale Americii.

fumul de tutun nociv, a fost de 25,8% ± 1,6%.

Lățimea intervalului de încredere - o marjă de eroare, înmulțită cu doi. De exemplu, să presupunem că marja de eroare este de 5%. Prin urmare, indicele de încredere interval în 7%, plus / minus 5% este de la 7% - 5% = 2% până la 7% + 5% = 12%. Aceasta înseamnă că lățimea intervalului de încredere este de 12% - 2% = 10%. O modalitate mai simplă de a determina acest interval - spune, că lățimea marjei interval de încredere de eroare este înmulțită cu doi. În acest caz, lățimea intervalului de încredere este egal cu 2 x 5% = 10%.

Lățimea intervalului de încredere - această distanță de la limita inferioară a intervalului (Prospects - marja de eroare) la limita superioară a intervalului (+ termostatul marja de eroare). Și pentru a determina rapid lățimea intervalului de încredere, limita de eroare poate fi înmulțită cu doi.

Următoarele descrie pașii pentru estimarea parametrilor cu intervale de încredere, și sfaturi, în cazul în care se pot găsi informații mai detaliate despre fiecare etapă.

1. Selectați nivelul de încredere și mărimea eșantionului (vezi cap. 9).

2. Efectuarea unui eșantion aleatoriu dintr-o multitudine de elemente (vezi cap. 3).

3. Colectarea de date fiabile și obiective pe celula de probă. Mai multe date de sondaj sunt descrise în capitolul 16, iar datele experimentale - în capitolul 17.

4. definesc statistica, de obicei secundare sau fracțiune (vezi cap. 5) Pe baza datelor.

5. Calculați limita de eroare (vezi cap. 10).

6. Analiza statistica plus / minus marja de eroare și de a da un parametru de evaluare finală.

Aceasta se numește un interval de încredere pentru parametrul.

Statistici pentru Dummies

Alegerea nivelului de încredere

Rețineți că, în exemplul atitudinii adolescenților la tutun fara fum (a se vedea. Secțiunea relevantă de mai sus) este expresia „interval de încredere de 95%“. Fiecare din intervalul de încredere (și, în cazul în care este vorba de faptul că, fiecare marjă de eroare) este un nivel de încredere asociat. În acest exemplu, nivelul de încredere a fost egal cu 95%. Nivel de încredere ajută să ia în considerare alte rezultate posibile pe care le-ar putea obține dacă ați face presupunerea, bazată pe o singură probă. Dacă doriți să fie de 95% sigur de celelalte rezultate posibile, atunci nivelul de încredere va fi de 95%.

Care este nivelul de încredere, cercetătorii folosesc de obicei? Există diferite niveluri de 80 până la 99%. Cel mai frecvent nivel de încredere - 95%. Statisticile ca să glumă: „De ce sunt statisticieni, cum ar fi munca lor? Pentru că au nevoie pentru a da răspunsuri corecte la doar 95% din cazuri. " (Este de remarcat, dar destul de bine?)

Asigurați-vă că la 95% - ceea ce înseamnă că, dacă faci o mulțime de probe și de fiecare dată, pe baza rezultatelor, se determină intervalul de încredere este de scădere intervale de încredere de 95% obținut dreptul la țintă, și anume, va reflecta cu adevărat parametrul adevărat. Pentru a obține un nivel de încredere de 95%, în conformitate cu o regulă de degetul mare trebuie să adăugați sau scădea „aproximativ“ 2 erori standard. Teorema limită centrală permite mai precisă pentru a apela acest număr, și așa mai departe „aproximativ 2“ înseamnă cu adevărat 1,96. Tabel. 10.1 Capitolul 10 prezintă câteva niveluri de încredere și -values ​​lor Z corespunzătoare.

Dacă doriți să fie încrezători în rezultatele mai mult de 95%, atunci trebuie să adăugați sau scădea mai multe erori standard. De exemplu, să fie asigurată de 99%, este necesar pentru a primi o limită de eroare, adăugând și scăzând trei abateri standard. Cu cât nivelul de încredere, cu atât mai mare este valoarea lui Z, mai lung și mai lat decât marja de eroare de interval de încredere (cu condiția ca toate celelalte date rămân aceleași). Pentru un plus de încredere să plătească.

Atunci când ipoteza enunț folosind încredere obiectiv principal interval este intervalul de încredere era îngust. Apoi, putem defini mai bine parametrul. Dacă adăugați și scade un număr mai mare, rezultatul va fi mai puțin precise. De exemplu, să presupunem că încearcă să determine procentul de vehicule

Capitolul 12. Calcularea intervalelor de încredere exacte

Statistici pentru Dummies

cu remorci de autostrăzi federale sa intre 12 si 18 ore, și ca rezultat au obținut un interval de încredere de 95%, potrivit căreia procentul acestor camioane este de 50%, plus / minus 50%. Intervalul este într-adevăr, în scădere! (Desigur, acest lucru este o glumă!) Cu toate acestea, uitați despre principalul lucru, încercând să dea o presupunere calitativă.

În acest caz, intervalul de încredere este prea mare. Ar fi mai bine să spună ceva de genul: 95% interval de încredere pentru procentul de autoturisme cu remorci pe autostrada federală între 12 și 18 de ore ale zilei este egală cu 50%, plus / minus 3%. Pentru a face acest lucru ar necesita un eșantion mai mare, dar faptul că ar fi necesar.

Deci, în cazul în care marja de eroare este mic - este bine, înseamnă că mai puțin - chiar mai bine? Nu întotdeauna. Pentru a maximiza intervalul de încredere îngust, trebuie să-și petreacă mult mai dificil - și costisitoare - de studiu, iar la un moment dat creșterea costurilor nu justifică ușoara creștere a preciziei. Majoritatea cercetătorilor în determinarea interesului (de exemplu, procentul de femei republicani sau fumători) marja de eroare în liniște conținut de 2% la 3%.

Un interval de încredere îngust - acest lucru este bun.

Dar cum să se asigure că intervalul de încredere a fost destul de îngust? Meditați această întrebare va avea înainte de colectarea de date, pentru că, după terminarea culegerii de date a lățimii intervalului de încredere este deja instalat.

Lățimea intervalului de încredere este influențată de trei factori.

Nivelul de încredere (așa cum sa menționat în secțiunea anterioară).

Gradul de variație a populației.

Formula marja de eroare în ceea ce privește eșantionul mediu, este: Z × s. în cazul în care n

Z - valoarea din distribuția normală standard corespunzătoare nivelului de încredere (a se vedea tabelul 1.10 din secțiunea 10 ..).

dimensiunea eșantionului (a se vedea capitolul 9) - n.

A apărut o eroare vezi cap. 10).

Intervalul de încredere pentru valoarea medie x este egal cu plus / minus o marjă de eroare. Capitolul 13 prevede formula cea mai comună de intervale de încredere, pe care le puteți întâlni.

Fiecare dintre acești trei factori (nivelul de încredere, mărimea eșantionului și variabilitatea populației) afectează foarte mult lățimea intervalului de încredere. Știi deja ce este impactul nivelului de încredere. În secțiunea următoare veți afla cum lățimea intervalului de încredere afectează dimensiunea eșantionului și variabilitatea populației.