Ég er búinn að leiðrétta færsluna eftir ábendingu frá Svavari Kjarrval (sjá umræður neðst). Þökk sé ábendingu hans áttaði ég mig á því að í útreikningi villumarka hafði ég reiknað með 0,68 þar sem átti að vera 0,068. Villumörkin breytast töluvert við endurreikninginn (±24% verða ±8%) en tölfræðileg ályktun breytist lítið þar sem ±8% telst líka vera óæsættanleg villumörk.
Áreiðanleikakönnun fulltrúa kjosum.is á undirskriftalista sem afhendur var forseta í vikunni er út í hött. Miðað við þau 74 svör sem fengust frá 100 manna slembiúrtaki eru villumörkin ±8%!
Þegar fulltrúar kjosum.is afhentu forseta undirskriftalistann sinn upplýstu þeir um að þeir hefðu kannað áreiðanleika undirskriftanna. Þetta gerðu þeir með því að hafa samband við 100 manna slembiúrtak af listanum og spyrja hvort viðkomandi hefði í raun skráð nafn sitt á vefnum þeirra. Það var tekið fram að ætlunin var að hafa samband við 800 manna úrtak (reikningar mínir hér fyrir neðan sýna að það hefði verið mjög viðeigandi fjöldi) en á endanum var haft samband við 100 "vegna tímaskorts". 100 manna slembiúrtak miðað við fjölda undirskrifta hefur nákvæmlega ekkert að segja. Forsvarsmennirnir hefðu alveg eins getað sleppt þessu.
Í tölfræði eru til nákvæmar aðferðir til að reikna úr hversu stórt slembiúrtak þarf til að tryggja áreiðanleika kannana. Forsvarsmenn kjosum.is hafa ekki séð ástæðu til að fylgja þeim leikreglum. Hérna ætla ég að sýna með mjög algengri reiknaðferð hversu stórt slembiúrtak hefði í raun þurft í þessu tilfelli. Ath. að það er ansi langt síðan ég hef stundað tölfræði á íslensku og er kannski ekki með íslensku hugtökin alveg á hreinu þannig að ég læt ensk hugtök fylgja með.
Formúlan sem við notum til að reikna lágmarksstærð slembiúrtaks er:
Við viljum tryggja sem hæstan áreiðanleika og þar sem þessi könnun er mjög einföld (aðeins ein spurning) ætti það að ganga. Þannig að við notum mjög hátt öryggisstig (e. confidence level) (þetta er ekki skoðanakönnun - okkur ber að heimta að gögnin eru mjög áreiðanleg), eða 99% og lága villutíðni (e. margin of error), eða ±3. Við skulum líka gera ráð fyrir að langflestir sem við höfum samband við hafi í raun skráð nafn sitt á undirskritalistann, segjum 90%. Setjum tölurnar í formúluna og þá er hún svona:
Við reiknum þetta og fáum út 663. Þetta er lágmarksstærð slembiúrtaks miðað við forsendur okkar og ótakmarkað þýði (e. population), þ.e.a.s. að fjöldinn sem slembiúrtakið er tekið úr er ekki tilgreindur. Sumum finnst þetta kannski heldur lág tala miðað við ótakmarkað þýði, en það er vegna þess að við gerum ráð fyrir að mjög fáir (aðeins 10%) hafi villt á sér heimildir við skráningu á undirskriftalistann. Þannig að óvissan er mjög lítil og þar af leiðandi þarf ekki stórt slembiúrtak. Við getum líka reiknað út slembiúrtaksstærð miðað við tiltekið þýði (þ.e.a.s. fjölda undirskrifta sem söfnuðust) en þar sem óvissan er svo lítil í þessu tilfelli hefur það lítið að segja (reyndar reiknaði ég þetta og þá var slembiúrtakið 652. Munurinn er vel innan villumarkana ±3 þannig að hann skiptir ekki máli).
Svo er rétt að snúa þessu öllu við og reikna hver raunveruleg villutíðnin er miðað við slembiúrtak forsvarsmanna kjosum.is. Þá reiknum við þetta svona til að fá staðalvilluna (e. standard error):
og fáum 0,03
Margföldum svo við z-gildið sem samræmist 99% öryggistigi:
2,576 x 0,03 = 0,08
Villutíðnin miðað við slembiúrtakið er ±8%!
S.s. þessi 93,2% sem sögðu "já" í áreiðanleikakönnuninni benda til þess að ef við framkvæmdum könnunina aftur mættum við gera ráð fyrir að milli 85,2% og 100% myndu svara "já" í hvert skipti sem hún er framkvæmd. Þetta telst ekki áreiðanlegt í tölfræðinni. Það er of mikil óvissa til að geta ályktað nokkurn skapaðan hlut.
Látið endilega vita ef þið sjáið eitthvað athugavert við útreikninga mína.
Ánægður með að Icesave-lög voru samþykkt | |
Tilkynna um óviðeigandi tengingu við frétt |
Meginflokkur: Stjórnmál og samfélag | Aukaflokkar: Fjölmiðlar, Menntun og skóli, Vísindi og fræði | Breytt 21.2.2011 kl. 15:56 | Facebook
Athugasemdir
En merkilegt hvað sumum er mikið í mun að grafa undan heiðarlegri undirskriftasöfnun vegna ICESAVE. Koma þeir nú hver á fætur öðrum undan steinum stjórnarflokkanna og finna hópnum sem stóð að verkinu allt til foráttu. Og þú ætlar að vera einn af þeim ómerkingum.
Nú hafa nokkrir svarað undirróðrinum:
E-mail var fjarlægt - - - Skekkjumæling kemur síðan í stað e-mail staðfestingar enda einfalt að komast fram hjá e-mail staðfestingu. Ég myndi telja það fullkomlega eðlilegt þar sem að engan vegin verður gengið út frá því að allir kosningabærir menn séu yfirhöfuð með e-mail, raunar er það nokkur fjöldi sem ekki er með slíkt.
Teitur og tölvan
Síðustu daga hefur maður gengið undir manns hönd til þess að gera undirskriftasöfnunina á vefsíðunni http://www.kjosum.is/ tortryggilega - - - Þeir sem það gera eiga það flestir eða allir sameiginlegt að [vera] fylgismenn eða félagar í Samfylkingunni eða Vinstri grænum - - -
Marktæk undirskriftasöfnun?
Eins og alþjóð veit hefur Teitur Atlason verið að ausa skít yfir þá sem standa að undirskriftasöfnun um að vísa Icesave III nauðasamningunum í þjóðaratkvæði. Hann heldur úti einu allra stærsta vettvangi rógburðar og persónuárása á DV-blogginu og er mjög grófur, jafnvel á mælikvarða DV.
Teitur Atlason sekkur á botninn
Elle_, 19.2.2011 kl. 20:10
Elle E.: Það þarf engin að "gera undirskriftasöfnunina ... tortryggilega". Hún bara er það.
Tryggvi Thayer, 19.2.2011 kl. 20:18
Nei, Tryggi, söfnunin var heiðarleg og ekkert verri en hinar fyrri. Og þú ert að gera hópinn og söfnunina tortryggilega viljandi.
Elle_, 19.2.2011 kl. 20:39
Elle E.: Ég hef ekkert sagt um heiðarleika undirskriftasöfnunarinnar né þeirra sem standa að henni. Hún er h.v. mjög tortryggileg. Hefurðu eitthvað við það sem ég segi í þessari bloggfærslu að athuga?
Tryggvi Thayer, 19.2.2011 kl. 20:46
Já já þú ert voða klár að reikna. Statistik er oft síðasta hálmstráið þegar á að sanna eða afsanna eitthvað.Málið er að fólk skráði sig á undirskriftarlista til að reyna að hafa áhrif á líf sitt og sinna til framtíðar. Ef þér finnst lýðræðið svona stærðfræðilega rangt reiknaðu þá út hvaða réttlæti sé að ríksstjórn sem nýtur um 30% fylgi geti skuldbundið alla skattgreiðendur nú og næstu 30 ára til að geiða eitthvað sem þeir hafa ekki skuldbunfið sig til. Formúlan er einföld hún heitir meirihlutinn ræður og hann er kannaður með þjóðaratkvæðagreiðslu.
Sveinn Úlfarsson (IP-tala skráð) 19.2.2011 kl. 20:52
Sveinn: Þú ert kominn langt út fyrir efnið. Forsvarsmenn kjosum.is notuðu tölfræðilegar aðferðir til að sýna fram á áreiðanleika undirskriftalista síns. Ég er að fylla í eyðurnar sem þeir slepptu í greinagerð sinni með stöðluðum aðferðum. Hvað ætti ég að nota annað en tölfræði til slíks?
Tryggvi Thayer, 19.2.2011 kl. 20:57
Ég tek undir með Sveini og endurtek að þú ert að gera þig að ómerkingi með því að styðja fjárkúgun gegn æsku landsins með ómerkilegum dæmum og útreikningum.
Hópurinn einfaldlega var í óeðlilegum flýti vegna ofsaflýtis ICESAVE-STJÓRNARINNAR við að pína nauðungina í gegn og hópurinn gerði það sem hann gat í tímaþröng við að bjarga þjóðinni frá lögleysunni. Talsmaður hópsins rökstuddi líka vel að þeir byggjust fastlega við að embætti forseta gengi úr skugga um lögmæti söfnunarinnar.
Minni á að InDefence hóf sína undirskriftasöfnun í nóvember og ICESAVE2 var ekki samþykkt fyrr en í lok desember og höfðu þannig miklu lengri tíma en þessi hópur sem hafði minna en viku.
Elle_, 19.2.2011 kl. 21:04
Elle E.: Hvað er það í þessari bloggfærslu sem þú hefur út á að setja? Hvað er það í því sem ég hef skrifað sem "styður fjárkúgun gegn æsku landsins"?
Tryggvi Thayer, 19.2.2011 kl. 21:08
Tryggvi, innra jafnvægi skortir í þessa útreikninga. Þú lagðir upp með áætlaða villutíðni (e. margin of error) sem ±3,0%, en endar með ±24%. Þetta telst varla gott samræmi.
Ég legg til að þú gerir reikninganna með öðrum gildum og sýnir okkur hver útkoman úr því dæmi verður. Ég legg til eftirfarandi forsendur, til að byrja með:
Margin of error = 10%
Confidence level = 85%
Estimated variance = 5%
Loftur Altice Þorsteinsson (IP-tala skráð) 19.2.2011 kl. 22:27
Loftur: Þú hefur greinilega ekki minnstu hugmynd um hvað þú ert að tala.
Tryggvi Thayer, 19.2.2011 kl. 22:37
Ég er ekki með neinar fullyrðingar Tryggvi, en þú segist vita um hvað þú ert að tala. Reiknaðu því dæmið Tryggvi, ekki getur þú látið svona misræmi sjást hjá þér.
Loftur Altice Þorsteinsson (IP-tala skráð) 19.2.2011 kl. 23:09
Ég tek uppbyggilegri gagnrýni opnum örmum en þá hlýt ég líka að gera kröfu um að viðmælendur viti um hvað þeir eru að tala. Að byggja gagnrýni á uppgerðri þekkingu sem er greinilega ekki til staðar er bara út í hött. Þú ert að blanda saman tveimur óskyldum útreikningum. Ef það er eitthvað í þessu sem þú skilur ekki og ert með einhverjar spurningar skal ég gjarnan svara þeim.
Tryggvi Thayer, 19.2.2011 kl. 23:42
Ég er ekki kennarinn þinn Tryggvi, svo að þú þarft ekki að óttast að falla á prófi hjá mér. Sýndu bara hvað þú kannt.
Loftur Altice Þorsteinsson (IP-tala skráð) 19.2.2011 kl. 23:52
Ég ákvað að prófa niðurstöðurnar á reiknivélinni á http://www.opinioni.net/sample.php og fékk nokkurn veginn sömu niðurstöðu á úrtaksstærðinni, þ.e. 654 m.v. 5% skekkjumörk, 99% nákvæmni og 38.000 manna þýði.
Hins vegar fékk ég ekki sömu niðurstöðu þegar ég reiknaði út skekkjumörkin m.v. úrtaksstærðina. Ég setti inn 99% nákvæmni, 100 manna úrtaksstærð, 74% svörun og þýði upp á 38.000. Niðurstaðan var 11,37% skekkja sem er langt frá niðurstöðu þinni upp á 24%.
Svavar Kjarrval (IP-tala skráð) 19.2.2011 kl. 23:55
Miðað við tvíliðudreifingu eru 99% líkur á að >82% undirskrifta séu réttar og 95% líkur á að >85% undirskrifta séu réttar. Að minnsta kosti fæ ég það út þegar ég set tölurnar inn hér: http://statpages.org/confint.html Líklegasta gildið er auðvitað 93%. Ég skrifaði ekki undir í þessari söfnun en mér finnst hún ekkert sérstaklega tortryggileg eða illa unnin. Ég er ósammála Tryggva um að þessi símakönnun segi ekki neitt. Jafnvel miðað við þær gífurlega ströngu kröfur sem Tryggvi gerir fær hann út að við hljótum að reikna með að a.m.k. 70% undirskriftanna séu réttar. Það eru heilmiklar upplýsingar.
Haukur Þorgeirsson (IP-tala skráð) 19.2.2011 kl. 23:55
Loftur: Það er ekki einu sinni hægt að ráða af tölunum sem þú gefur upp hvað það er sem þú vilt að ég reikni. Mér sýnist þú vera fara fram á að ég reikni úrtaksstærð miðað við þessar tölur. Það er út í hött því miðað við þessar tölur ertu tilbúin að sætta þig við svo mikinn óáreiðanleika að úrtaksstærðin myndi vera fáranlega lítil.
Tryggvi Thayer, 20.2.2011 kl. 02:29
Svavar: Þetta er hárrétt hjá þér!
Ég sé núna að ég reiknaði með 0,68 þegar það átti að vera 0,068 (enda var 24% eiginlega út í hött!). Takk fyrir þessa ábendingu. Með þessari leiðréttingu fæ ég villtutíðni 8%, sem er mun "raunverulegri" útkoma. Ástæðurnar fyrir því að reiknivélin sem þú notar gefur hærri villutíðni geta verið margvíslegar, t.d. sé ég að þú notar þýðið í reikningnum sem ég geri ekki. Almenn regla er að ef úrtak er minna en 5% af þýðinu er ástæðulaust að reikna með takmörkuðu þýði.
Það er auðvitað töluverður munur á 8% og 24%. Hins vegar hefur munurinn lítið að segja fyrir tölfræðilegar ályktanir þar sem 8% telst vera óásættanleg villutíðni. S.s. að könnunin telst marklaus.
Færslan verður löguð til að leiðrétta þetta.
Tryggvi Thayer, 20.2.2011 kl. 02:31
Haukur: Ég held að það sé ekki rétt að miða við tvíliðadreifingu í þessu tilviki. Það er mjög hæpið að það séu jafnar líkur á að svarendur svari já eða nei. Við gerum ráð fyrir að langflestir sem lenda í úrtakinu skráðu sitt nafn viljandi.
Ég geri strangar kröfur vegna þess að þetta er ekki skoðanakönnun og áreiðanleikakönnuninni er ekki ætlað að veita okkur "heilmiklar upplýsingar" heldur að staðfesta að þeir sem eru á undirskriftalistanum skráðu í raun nöfnin sín. Ef 70% undirskriftanna eru réttar þýðir það að næstum þriðjungur undirskriftalistans er falsaður. Það er óásættanlegt.
Tryggvi Thayer, 20.2.2011 kl. 02:38
"þetta er ekki skoðanakönnun - okkur ber að heimta að gögnin eru mjög áreiðanleg"
Endilega útskýrðu nákvæmlega hversu áreiðanleg skal heimta að gögnin séu.
Útskýrðu líka gjarnan hvers vegna undirskriftasöfnun á að vera nákvæmari en skoðanakönnun. Þetta eru ekki löggildar kosningar og aðstandendur undirskriftasöfnunarinnar hafa aldrei haldið neinu slíku fram.
Einnig væri gagnlegt ef þú myndir útskýra hvernig þessi tiltekna undirskriftasöfnun er eitthvað verr framkvæmd en aðrar sem hingað til hafa verið gerðar, hvort sem er rafrænt eða á pappír.
Það hefur enginn haldið því fram að niðurstaðan sé hárnákvæm. Hinsvegar hafa andstæðingar þess að haldin sé þjóðaratkvæðagreiðsla verið duglegir að halda því fram að hún sé ónákvæm. Geturðu útskýrt þetta ójafnvægi?
Guðmundur Ásgeirsson, 20.2.2011 kl. 02:49
Guðmundur: Þar sem undirskriftalisti er safn persónulegra yfirlýsinga finnst mér ekki óeðlilegt að fara fram á 100% áreiðanleika.
Skoðanakönnun er ætlað að veita almenna innsýn í skoðanir, gildi o.s.frv. hóps til að alhæfa um yfir á þýði. Skoðanakönnun felur því ekki í sér persónulega yfirlýsingu þar sem ekki er hægt að eigna neinum einum þær skoðanir, gildi o.s.frv. sem alhæft er um. Þegar fólk skrifar undir undirskriftalista er það persónuleg yfirlýsing sem fólk ljáir nafni sínu af fúsum og frjálsum vilja og gerir yfirlýsinguna sem tekið er undir að sinni eigin. Ef einhver þykist vera ég þegar það tekur þátt í skoðanakönnun þá skiptir það engu máli því ég hafði jafnmikla möguleika og sá til að verða í úrtakinu. Ef einhver falsar nafn mitt á undirskriftalista sem ég hefði aldrei skrifað undir af fúsum og frjálsum vilja er verið að leggja mér orð í munn. Það er verið að ljúga upp á mig og nota mitt nafn til að blekkja aðra.
Ég hef ekkert sagt um aðrar undirskriftasafnanir þannig að ég hef ekki hugmynd af hverju þú spyrð um þær.
Ég sé ekkert ójafnvægi í því að engin haldi því fram að undirskriftasöfnunin sé hárnákvæm og að einhverjir haldi því fram að hún sé ónákvæm.
Tryggvi Thayer, 20.2.2011 kl. 03:47
Fatta ekki alveg afhverju þú ert að reikna þetta út - það vita allir að þetta úrtak var of lítið og það var sagt þegar þetta var kynnt að þetta væri of lítið úrtak. Það hefði ekki verið tími í meira fyrir fundinn með forsetanum.
Það hafa farið fram ótal undirskriftarsafnanir með sama eða sambærilegu sniði og þessi og aldrei farið fram neitt "sannleiksmat".
Þeir sem vilja geta látið fletta upp sinni kennitölu með því að hafa samband við vefstjóra kjosum.is og verið þannig vissir um sína skráningu.
Það hefur aldrei verið krafa um 100% áræðanleika í undirskriftasöfnunum áður. Skil ekki afhverju þú villt krefjast þess nú.
En það mætti auðvitað vera til einhverjar obinberar leiðbeiningar hvernig skuli standa að undirskriftarsöfnunum og hvernig sé hægt að gera þær sem áræðanlegastar.
Sigurður Jónas Eggertsson (IP-tala skráð) 20.2.2011 kl. 04:08
Ég reikna þetta út af því að ég hef gaman af því.
Ég hef ekki krafist 100% áreiðanleika. Mér finnst ekkert að því að fara fram á 100% áreiðanleika vitandi að það næst ekki og í reikningum mínum geri ég ráð fyrir 99% áreiðanleika.
Tryggvi Thayer, 20.2.2011 kl. 04:20
Ef ég skil þig rétt þá ert þú að segja að 33.000 haf alveg örugglega verði rétt.
3,0% eða um 1450 manna úratak um gefa 99% rétt mat. 1% skekkju mörk.
Þannig að auðvelt er að álykta að miklum tíma hefur verið varið í að lítisviða þenna stóra kjósenda hóp sem vor að baki áskorunni alveg örugglega.
Mað spyr sjálfa sjálfa sig hvort sumir eigi bágt? Hvor þeir óttist úrslit þjóðaratkvæðagreiðslurnar í framhaldi vegna ömurlegs málstaðar?
Einhver hlýtur tilgangur að vera með fyrirhöfninni!
Júlíus Björnsson, 21.2.2011 kl. 00:01
Júlíus: Nei þú ert ekki að skilja mig rétt. Bloggfærslan fjallar ekkert um fjölda áreiðanlegra undirskrifta né undirskriftasöfnunina sem slíka. Hún fjallar um áreiðanleikakönnun forsvarsmanna kjosum.is.
Þessar tölur sem þú notar í útreikninginn þinn eru forsendurnar sem ég notaði til að reikna út hæfilega úrtaksstærð fyrir áreiðanleikakönnun. Þær eru ekki leiddar af endanlegum gögnum heldur ákveðnar (af mér) til að reyna að tryggja ákveðinn áreiðanleika niðurstaðna áreiðanleikakönnunar. Þær segja ekkert um fjölda áreiðanlegra undirskrifta frekar en hinar tölurnar sem notaðar eru í útreikningum mínum.
Það er auðvelt að álykta hvað sem er ef þú skilur ekki það sem þú ert að álykta út frá.
Tryggvi Thayer, 21.2.2011 kl. 02:21
Aðalatrið er að áreiðanlegt er að stórhluti í erlendum samanburði er vel innan skekkju marka 8%. Þannig ekki þarf að eyða miklum tíma í að sanna það ef menn eru talna glöggir á annað borð.
Ef 7.000 sannaðar með 100 % tékkun væru fals þá myndu flestir draga þá ályktun að andstæðingar þess að þjóðin fengi aftur að eiga síðasta orðið um sína framtíð næstu 30 árin bæru ábyrgð á því að mínu mati.
Ég er ekkert að gera athugasemd við fomúlurnar. Heldur í hvað tilgangi sumir eru að nota þær. Gera úlfalda úr mýflugu.
Svo sést það í best í þjóðaratkvæðagreiðslunni sjálfri hvað mikill hluti kjósenda tekur þátt og þá er ekki hægt að falsa mikið.
30.000 og 60% í nýlegri skoðanakönnun. Það eru fullnægjandi rök hjá flestum.
Júlíus Björnsson, 21.2.2011 kl. 04:08
Júlíus: Ég veit ekki hvað það er sem þú ert að reyna að segja en þetta er sennilega ekki rétti staðurinn fyrir það. Þessi grein fjallar ekki um undirskriftalistann. Er eitthvað sem þú vilt segja um efni greinarinnar?
Tryggvi Thayer, 21.2.2011 kl. 05:41
100 manna slembiúrtak miðað við fjölda undirskrifta hefur nákvæmlega ekkert að segja. Forsvarsmennirnir hefðu alveg eins getað sleppt þessu.
Júlíus Björnsson, 21.2.2011 kl. 11:07
Júlíus: Einmitt. Og...?
Tryggvi Thayer, 21.2.2011 kl. 13:12
Það hefur þó nokkuð að segja í mínum augum. Það réttlættir að eyða ekki meira tíma og kostnaði til að staðfesta að stór hluti vill þjóðaratkvæðagreiðslu.
Allmennt er 3,0% fullnægjandi þegar heildar fjöldi skiptir þúsundum og stefnir á 100% áreiðanleika, sem á við þegar slíkur áreiðanleiki er nauðsynlegur.
Þetta geta menn sannað fyrir sjálfum sér.
Júlíus Björnsson, 21.2.2011 kl. 13:33
Júlíus: Já, 3% er viðunandi. Þess vegna notaði ég 3% þegar ég reiknaði hæfilega úrtaksstærð. En raunveruleg niðurstaða úr áreiðanleikakönnun forsvarsmanna kjosum.is var 8%. Í tölfræðinni þykir það ekki viðunandi. Þá er metið svo að tilraunin hefur alltof lítið vægi til að teljast markverð. Úrtakið gefur ekki nægilega áreiðanlega mynd af þýðinu.
Tryggvi Thayer, 21.2.2011 kl. 13:49
100 gefur áreiðanlega vitbendingu um að vel yfir 10% Íslenskra kjósenda vil þjóðaratkvæðagreiðslu. Í ljósi annarra forrsenda auðveldar það forseta að taka ákvörðun. Auðvitað er æskilegra vegna almennings sem hefur ekki vald á hlutfallslegu samhengi að nota stærra sýnshorn til að losna við athugasemdir og efahyggju sem skipta litu máli fyrir tilganinginn og niðurstöðuna. Svo tel ég allar líkur á að væri tekið stærra sýnishorn þá myndi það auka áræðinleika þess að um 40.000 áskornir væru ófalsaðar. Það þykir ekki viðunandi í tölfræðina til að segja um áreiðanleika upp á 40.000- Tölfræði eru vísindi kaldra raka. Abstract hugsun er hinsvegar ekki öllum gefin.
Júlíus Björnsson, 21.2.2011 kl. 14:26
Júlíus: Þú ert að lesa allt of mikið úr þessum tölum. Þessar tölur segja í raun ekkert um íslenska kjósendur né þá sem eru á undirskriftalistanum. Tölurnar segja okkur með hversu mikilli vissu við getum spáð fyrir um útkomuna ef við fræmkvæmum sömu könnun með öðru 100 manna úrtaki. Ef við erum með mjög áreiðanlega könnun, segjum 99% vissu og ±3 þá getum við gert ráð fyrir að ef við framkvæmum aftur sömu könnun þá verða niðurstöður á mjög svipuðu bili og í fyrri könnuninni. T.d. segjum að við séum með 99% vissu og ±3 og í könnuninni - með 100 manna úrtaki - kemur í ljós að 93% sögðu já. Þá eru 99% líkur á að í hvert skipti sem við fræmkvæmum sömu könnun aftur með öðru 100 manna úrtaki að hlutfall já svara verði milli 90%-96% (93-3 og 93+3). Við erum að miða við að við getum framkvæmt þessa könnun með 100 manna úrtaki ótal sinnum. Við gætum fengið 91% í nokkur skipti, 92% í einhver skipti, eða jafnvel 95% í einhver skipti. En þar sem mikill fjöldi gilda tekur alltaf á sig normal dreifingu (þ.e.a.s. kúrvu sem er hæst í miðjunni og lækkar á svipaðan hátt í báða enda) getum við gert ráð fyrir að í langflestum tilvikum myndi fjöldi já svara vera í kringum 93%. Þá getum við leyft okkur að álykta að fjöldi já svara hjá öllum hópnum sé ca. 93%.
Reikningarnir mínir sýna h.v. að líklegur munur á útkomunni í hvert skipti sem við framkvæmum könnunina er allt upp í ±8%. Þannig að við getum sagt að 99% líkur er á því að ef við framkvæmum sömu könnun ótal sinnum verða já svör einhversstaðar á bilinu 85%-100% (93-8 og 93+8, en við getum ekki farið upp fyrir 100%). Það eru enn líklegast að í flestum einstöku tilvikum verða já svör um 93%. Hins vegar er dreifingin það mikil (normal kúrvan það breið) að samanlögð tíðni útkoma þar sem fjöldi já svara er fyrir neðan eða fyrir ofan 93% gæti verið hærri en fjöldi einstakra kannana sem gefa 93% já svör. Þá er orðið mjög hæpið fyrir okkur að fullyrða að það séu 99% líkur á að fá ca. 93% já svör í langflest skipti sem við myndum framkvæma könnunina með 100 manna úrtaki.
Ég er fullkomlega sammála þér að stærra úrtak hefði leitt í ljós að tiltölulega lítið væri um rangar skráningar á undirskriftalistanum. Það er "pointið" í greininni.
Tölfræði er ekki vísindi kaldra raka. Tölfræði er hagnýt vísindi líkinda.
Abstract hugsun er víst öllum gefin og sennilega réttast að segja að hún sé mönnum eðlislæg. Án abstract hugsunar væri nær ómögulegt að segja nokkurn skapaðan hlut um heiminn okkar. H.v. eru fáir sem skilja tölfræði, hvernig hún virkar og hvað hún segir okkur. Miðað við hvað hún er mikið notuð í kringum okkur er kannski ástæða til að huga að því í menntakerfinu okkar.
Tryggvi Thayer, 21.2.2011 kl. 15:55
Tölfræðina er hægt að nota í þjónustu í þágu hagnýtra vísinda. En í grunni stærðfræði og því í samræmi við sitt eðli.
Til fróðleiks!
Þess vegna er fákeppni í rekstrargeira á einsleitum markað ólíðandi. Því úr sínu tvíhliða bókhaldi getur meistarinn síðustu aldirnar ef hann ræður yfir 3,0% sýnishorni, sagt fyrir með miklum áreiðanleika um hin 97%. Frjáls keppnismarkaður gerir því ráð fyrir max 3,0% markaðshludeild og min 100 þátttakendum í hagfræðikenningum meistaranna hér áður fyrr.
Vitur nærri getur Reyndur veit þó betur. Légleg grunnmentun bakkar upp virðingu fyrir fákeppni.
Hagræðing er viðeigandi þegar frjálsri keppni verður ekki komið við. Dæmi herafli USA er einn á heimmarkaði.
Júlíus Björnsson, 21.2.2011 kl. 16:37
Bæta við athugasemd [Innskráning]
Ekki er lengur hægt að skrifa athugasemdir við færsluna, þar sem tímamörk á athugasemdir eru liðin.