Vad menas med 'statistiskt säkerställd' egentligen? Jo....
Ofta då media presenterar resultat av opinionsundersökningar för partisympatier, skriver de om förändringar t ex "+ 0,3 procentenheter" eller "- 0,7 procentenheter" med ett typiskt tillägg:
"Förändringarna ligger inom felmarginalen"eller "Förändringen för parti X är inte statistiskt säkerställd" Jaha? Hello there.......Vilken betydelse har detta i det stora sammanhanget?........
En statistisk säkerställning och en kanelbulle, tack...!.. Nu senast visar en undersökning att Kristdemokraterna kanske skulle hamna under riksdagens fyraprocentsspärr om det vore val idag: 3,9%
Jag ska försöka förklara 'statistiskt säkerställd' och 'inom felmarginalen' så att alla som läser detta begriper till en praktisk utsträckning. Annars får ni klaga på mig. ;) Jag pysslar trots allt med statistik på dagarna.
Enkäter och opinionsrundringningar är exempel på så kallade stickprov. Inom stickproven arbetar man med förändringar.
Varje stickprovsundersökning har en felmarginal, inom ett s k konfidens-intervall (från latinets confidentia, tilltro). Konfidensintervallet anger graden av osäkerhet för ett mätvärde.
Varje konfidensintervall har en konfidens-GRAD, jag gissar på 95% i partisympati-fallet.
Detta betyder, i klarspråk, att: Det sannolika värdet för undersökningen man gjort, ligger, med 95 procents säkerhet, inom konfidensintervallet. Inom felmarginalen, alltså.
Eller rättare sagt: Vid ungefär var 20-e opinionsmätning ( = 5% av fallen), inkluderar inte felmarginalen det riktiga värdet.
Exempel: 95%-iga konfidensintervallet 25 +/- 3 (25 plus/minus 3) innebär:
...att intervallet [22, 28] tagits fram genom en stickprovs-metod som i 95 fall av 100, ger ett intervall som innehåller det sanna värdet för väljarkårens opinion. Någonstans däri befinner sig i så fall det vi letar efter. 24 hamnar inom felmarginalen, men inte t ex 29.
När det står: "Förändringarna ligger inom felmarginalen", vad betyder det då? Jo, att det nya procentvärdet (från den aktuella mätningen, B) och det gamla (för förra mätningen, A) har felmarginaler som överlappar varandra. Dvs de har ett litet gemensamt intervall, det finns alltså en möjlighet att ingen förändring skett egentligen.
Exempel: Om förra mätningen resulterade i 4,2 +/- 0,2 och dagens mätning resulterat i 3,9 +/- 0,2, så kan de egentliga värdena för båda undersökningarna bli t ex 4,0 eller 4,1. Vi kan alltså i det fallet inte utesluta att opinionsförändringen kanske inte ens skett.
Hmmm....fråga vid första anblick.....varför kan man inte använda ännu större säkerhet än 95%? T ex 97%? Eller, vänta...100% ?
Jo, därför att det blir omständligt. 100 procents säkerhet visar att man VET vari det rätta svaret ligger, i det här fallet riksdagsvalets utgång.......
....det gör man bara vart fjärde år......då man räknat precis alla rösterna.........men, men... 98 %-ig säkerhet, då? Fast då gissar undertecknad att man får fråga många, många fler än de 1000-2000 man brukar ringa runt till..... dyrt och omständligt, och kanske en smula störande för vanligt folk som då skulle bli störda med telefonsamtal mitt i maten nästan varenda dag.
......Fråga vid ANDRA anblick:
Ett ögonblick, hur VET man vilket som är felmarginalen? Och varför är man så säker (95%), på att "sanningen" ligger inom ett visst intervall?
Jo, man har gjort en prognos med väntevärden, för denna typ av undersökningar, dvs de förväntade värdena på de olika parti-sympatierna, samt på standardavvikelser. (+ att man har formler för hur felmarginal beräknas men det kan jag ta upp en annan gång)
Det uppmätta resultatet t ex
KD 3,9%, ska ha en felmarginal som inte överlappar den förra mätningens felmarginal.
Några frågor?
Blog reactions to this post:
Dålig utveckling (Johan S)
Ps. Fortsättning följer i följande inlägg: Valår och statistiska felmarginaler
26 kommentarer:
Oh...tar mig för pannan och suckar lite. Siffror är definitivt inte min grej. Du kanske kan hjälpa mig att förklara hur man på bästa sätt överför små meningslösa statisktiska uppgifter till flaschiga OCH talande staplar i excel.
Hosanna
Excel? Jobbigt....
Ska tänka på det. jag är word-galen, jag vet, men jag brukar göra det snyggt i Word (enligt mig själv ;))
Z,
Byt genast till OpenOffice! :)
Om du nu sysslar med statistik dagarna i ända så kan du väl skriva en pedagogisk lärobok på svenska? Mina studenter klagar ständigt på att de inte begriper någonting av statistiken. Din pedagogiska nivå når helt andra höjder än min. :)
Johan
Ok, planerar att byta till Open, gillar allt som heter något med "Open Source"
Grattis till tusen till dina vetenskaps-publiceringar!
Snabbt pedagogiskt tips:
Gör som fysikern Cecilia Jarlskog:
Använd humor och grälla Aftonbladet-färger, samt ibland krigsrubriker.
Jag tänker hela tiden på hennes kvarkar nu.
"Statistiskt säkerställd" är ett mått på när förändringen kan sägas vara "tillräckligt säker". Men när är den det? Det är helt godtyckligt.
Varje positiv förändring ökar förstås sannolikheten att partiet verkligen har gått upp i NÅGON mån. Så, begreppet statistisk säkerställt är rätt värdelöst egentligen. Det man kan ta med sig är att små förändringar har större sannolikhet att bero på mätfel än stora (men det är ju självklart egentligen).
Grue Välkommen hit
Javisst är det godtyckligt, det baseras på historiska resultat: erfarenhet.
Och valresultatet brukar avvika från opinionsundersökningar. Visst.
Till största del har du rätt,
små förändringar kan ofta bero på mätfel, men även jättestora förändringar kan bero på snedvriden utfrågning.
Felmarginalen har en gräns uppåt också.
Oj sorry, jag missade din längre utläggning om begreppet. Trodde du faktiskt vill ha svar, men din fråga var ju retorisk! Tips: byt design så får man bättre överblick.
Bra genomgång av begreppet.
Vad tror du om dom som säger att Sd systematiskt underskattas i opinionsmätningar? Alla mätningar pekade på att Sd skulle få mindre än dom 2,93 % man fick i mätningen. Vet du hur mätningarna går till? Har hört att man blandar in gamla mätningar för att undvika variationer vilket kan leda till att man underskattar partier på uppgång.
Mvh/Grue
Grue
Jag frågade en gång om de slumpar postnummer, men de slumpar helt enkelt ut telefonnummer och ringer vid olika tider under dagen/kvällen.
De som oftast är hemma svarar och kvinnor är väl oftare hemma än män, aningens i alla fall, och bland dem är Sd-sympatierna lägre, verkar det som. Detta var ett vilt spånande, kan också bero på andra orsaker.
Röstar man på Sd kanske man känner sig orolig för att berätta detta, och väljer att hemlighålla det ända fram till valdagen...
Man kan jämföra med nu aktuella Sd-siffror, eller, de som kom månaden efter valet.
Äsch, det kan vara tusen orsaker. ;)
Se detta inlägg om hur underskattade Sd är. Finns mer i tråden också:
http://www.flashback.info/showpost.php?p=8489047&postcount=35
Z,
Ja, jag har en fråga... :-)
Hur "statistiskt säkerställt" tror du det är det att den där chokladkakan på översta bilden är lika smaskig i verkligheten som den ser ut?
Jag skulle nästan tippa på att vi där kan nå en 98%-ig nivå...
Slurp!
Charlotte
Du ser, t.o.m. orden hamnar huller om buller...
Elfte (blogg)budet är härmed instiftat:
"Du skall icke fresta dina bloggläsare med alltför munvattnande bilder...."
Charlotte
Charlotte
Men om man kollar bilderna på din konstlänk, verkar du vara en riktigt smal och smärt kvinna.
Visst, tårtan var lite pr för att läsarna skulle orka ge sig i kast med ett statistik-inlägg.....
Tippar med 95% säkerhet att den var smasken, ja :)
Z,
Ja, det stämmer - bränner energi betydligt snabbare än jag hinner fylla på.
Tror det beror på allt tänkande...
Så den dag jag slutar blogga hamnar jag nog i den "chokladiska riskzonen".
Men jag lyfte nu inte fram detta som en tungviktsfråga. Det var mer lättsamt menat... :-)
Charlotte
Z; word går lika bra för jag är helt rudis, så vilket program jag sjabblar med gör detsamma. *s*
En statistisk säkerställning och en kanelbulle, tack...!
~~~~
Nåt för 2010 års projekt.
jag har en fråga...
om intensiteten lamda e = 0,025 olyckor per dag....
va e då sannolikheten att 2 olyckor inträffar på tre dagar i följd!?
James Bond Välkommen!
P[(N(t + tau) - N(t) = k]=
= (e^-(lambda x tau) x (lambda x tau)^k)/(k!)
...menar du att det på tre dagar inträffar sammanlagt 6 olyckor?
I så fall:
Sannolikheten(N(t+3)-N(t)=6)=
=(e^(-0,025x3) x (0,025x3)^6)/(720)
^ betyder "upphöjt till"
....& så uträkningen:
0,9277x1,8x10^(-7)/720 = (om jag räknat rätt) 2,93x10^(¯10)
En extremt liten sannolikhet
Nu är jag lite sent ute på denna tråd :) Men jag googlade på "statistiskt säkertställt" och tog mig hit och har nu en fråga:
Om ett antal personer får testa en mjukvara under en viss tid och sedan fylla i ett formulär och bedöma trolig kundreaktion, hur kan man se till att det blir statistiskt säkerställt? Beror det på antal personer som gör testet (och förutsatt att alla svarar) eller något annat?
Mvh Sandra
Hej, Sandra, welcome to the crypt
Statistisk säkerställning handlar i huvudsak om att fastställa ändringen från en undersökning till nästa, till exempel ändring av enkätbesvararnas medelbetyg, i din kundundersökning.
Om felmarginalerna för de båda enkäterna bara tangerar varandra eller är utanför varandra, så är ändringen säkerställd. överlappar de, så är ändringen inte säkerställd, ty den är "inom felmarginalen".
När det gäller en enda undersökning, så är det bra att ha en så liten felmarginal som möjligt, dvs att enkätens medelbetyg så väl som möjligt korresponderar med det "sanna" medelbetyget. Ju fler svarande desto mindre felmarginal (i mån av tid och budget för undersökningen)
Om du vet standardavvikelsen (S) för denna typ av enkäter/medelbetyg, så har du Felmarginalen =
kritiska värdet (= 1,96 för 95% konfidensgrad) * S/roten ur(N) där N = antalet personer som deltar i enkäten.
Felmarginalen = 1,96 * standardavvikelsen/roten ur(N)
Det "sanna" medelbetyget ligger alltså i intervallet +/- felmarginalen från det medelbetyg som enkätsvararna gav.
Som du ser så står N i nämnaren, alltså är felmarginalen mindre, ju större N är, dvs ju fler som deltar i undersökningen.
mvh
/z
(Ps. Fråga gärna mer, så återkommer jag med exempel på värden)
Många svar som man ger i en enkät blir på måfå. Man kunde ofta ha svarat på annat sätt om man var på annat humör eller man har helt enkelt uppfattat frågan på olika sätt, Men bortsett det att försöka påstå något som ska hända med stöd i statistiken är att jämföra med religion.
Den enda kunskapen som är helt säker är den matematiska härledningen, eftersom den är absolut analytisk, Det som säg i slutsatserna är redan sagt på annat sätt i premisserna. Men om man använder annat än kvantitativa tecken, då blir även härledningen problematisk. Statistiken är ett tricks som går ut på att inbilla oss att något kan förutsägas genom att liera de givna observationerna (som dessutom tas för entydiga) med siffror. Maskering genom matematik ger ett bra intrych och gör sig trovärdigt. Med matte kan man emellertid bara tala med säkerhet om det förflutna, inte om framtiden. Kloka vetenskapsmän använde principen om "ceteris paribus" (om allt annat förblir oförändrat) för att bevisa säkerheten i ett fenomen som testas i labbet. Det kan man bara göra med fysiska experiment, sådana som går att upprepa, för attesta en gång till.
Att köra med statistik för att förutsäga kommande sociala situationer är bondfångeri, rent löfte som när vi lånar pengar. de förklaringas son du lämnar för att bevisa att du kan bevisa med statistik är rena rapakalja. Det är riktigt attvi alltid bildar oss en uppfattning och att i ibland har bättre insiktsmöjligheter än andra, men att tala om 95 % är bara ett retoriskt sätt att försöka säga åt vilket håll man tror det lutar. Naturligtvis att hävda att något ska hända med stöd SADISTIK alltid kan få några att välja och göra något, när de inte visste vad de skulle göra. "för säkerhets skull" betyder: så att jag tror på något och lugnar ner mig. Religion alltså.
Hej och välkommen, José Ramirez
Du lättade på hjärtat och sjöng ut! Om du inte har något emot det så låter jag i nuläget bli att kommentera ditt inlägg, för det är fyllt av olika känslor ser det ut som, allmänfilosofiska funderingar, och jag hittar inte den specifika detaljerade kritiken mot just mina förklaringar i inlägget.
mvh
/z
Hej igen, José Ramirez, jag har funderat ett tag på ditt inlägg och lämnar en reflektion på förslag från en annan kommentator, ctail,
att vi för vår överlevnad är tvungna att åtminstone ibland lyckas förutsäga skeenden innan de äger rum,
och man undrar om du har något bättre förslag till hur vi lyckas med det än genom att göra generaliseringar utifrån erfarenheter av det förflutna.
Induktionsproblemet kvarstår som vanligt, men samtidigt är induktiva slutsatser, utifrån stickprov och korrelationer, analyserade med hjälp av matematiska och t ex fysikaliska formler (Obs. Även t ex antagandet om tyngdkraften bygger på korrelation och är strikt taget inte bevisad), det enda verktyg vi har för att vetenskapligt söka kunskap om naturen, samt försöka förutsäga skeenden innan de äger rum.
Så trots statistikens alla fel och brister, så ger den vägledning i vår vardag, hjälper oss, i stort, att överleva.
mvh
/Z
Vet inte om den här tråden lever än. Jag har en fråga som inte gäller enkäter utan om ren matematik.
Om vi slår en (perfekt sexsidig)tärning tillräckligt många gånger så vet vi ju att varje siffra kommer att ha träffats 16,666...%. (Eller "gå mot" kanske är bättre) Min fråga är hur många gånger behöver vi upprepa försöket för att ha eliminerat variansen? (Vet inte den exakta definitionen av varians men det jag menar är det som slumpen kan ställa till med. Till exempel fem sexor i rad osv...)
Låt säga att vi ska komma till +/- 1% från 16,666...
Det är i andra sammanhang jag vill använda informationen.
Mvh
Christer
Min fundering är hur stort urval i en enkät, i detta fall kundenkät. Är 500 enkäter till 65 000 kunder, med 175 svar (0,002 %) tillräckligt för att säga att det är "statistiskt säkerställt"? finns det någon siffra för att säga att det börjar vara statistiskt värt någonting?
Bäste Z,
Jag tycker in om att tala med spöken. Jag talar i eget namn och du heter bara Z.
Din utgångspunkt var att om jag går omkring och ställer en fråga till ett antal personer och får ett svar, kan jag sedan dra en slutsats om hur alla de inte frågade skulle ha svarat. Det är en farlig generalisering, men själva publiceringen av resultatet kan i sig kanske påverksa dem som inte tillfrågats.
I grunden ligger dock inbillningen om att min fråga var helt riktigt formulerad, att var och en förstod den exakt likadant och att svaren, givna ur olika personliga situationer, är jämförbara. Sedan kan man dessutom fundera på att några svarar på et mer genomtänkt sätt änandra. Ditt problem, Z, är attdu vill jämföra en lös undersökning av "tyckanden" med en empirisk etenskaplig
undersökning av naturfenomen eller dylikt. När den positiva vetenskapen gör en induktion, då grundar den sig på helt precisa fakta. Det råder då två vetenskapliga säkerhetsprinciper: CETERIS PARIBUS och Poppers falsifikationsprincip, som ett slags säkerhet på att man drar korrekta slutsatser. Att jämställa naturvetenskapliga falta med "åsikter" är ändp ganska magstarkt. José Ramírez
Skicka en kommentar
Sjung ut