Valår och statistiska felmarginaler....
....here I go again. Min förra post om statistisk säkerställning (där gällde exemplet KD-partiet) blir så pass ofta besökt nuförtiden, enligt besöksmätaren (sidan ligger väl högt på Googles träfflista eftersom det eftertraktade mystiska begreppet "statistiskt säkerställd" står i rubriken redan), att jag behöver lufta saken igen, lägga upp den på bordet: Pga era ymniga besök så har jag sett till att justera inlägget ifråga, rätta felaktig a formuleringar, lägga till relevant information jag hade glömt, etc.
Kanske bäst att även ta upp ett aktuellt exempel: ur DN:
"Sverigedemokraterna sjunker klart under riksdagsspärren i Skops senaste väljarbarometer. Från 5,0 till 2,9 procent, ett ras som är statistiskt säkerställt."
Detta betyder alltså att den aktuella mätningens (B) felmarginal och den förra mätningens (A) felmarginal inte överlappar varandra. Vi kan om detta stämmer förkasta möjligheten att ingen förändring egentligen skett.
Felmarginal beräknas ofta enligt följande approximation (men förmodligen är det inte exakt denna formel som använts av Skop; den duger dock för att vi ska kunna få oss en uppfattning om läget):
1,96 x roten-ur(p(100 - p)/n)
där 1,96 står för det "kritiska talet" vid 95% konfidensgrad
(95% konfidensintervall innebär att (Nationalencyklopedins formulering): Om hundra institut gör var sin studie, blir ungefär fem intervall felaktiga, dvs. innehåller inte den korrekta väljarandelen. Vid högre konfidensgrad görs intervallen bredare och fler blir riktiga.). p står för procentsatsen (andelen svarande som angav SD som parti, 2,9%), , som man fick fram i enkäten ifråga, och totala antalet som svarade i opinionsmätningen var 1 133 personer = talet n.
Förra mätningen av Skop (april 2010) hade tydligen 1058 svarande, och 5% av dessa uppgav SD.
Felmarginalen för procenttalen, p1 och p2, i de båda undersökningarna (5% resp. 2,9%) räknas ut ungefär så här:
(en formel som endast kan användas då man har samma typ av standardavvikelse på de båda stickproven)
1,96 x roten-ur(p1(100-p1)/n1 + p2(100-p2)(n2) =
1.96 x roten-ur((5x95/1058)+((2,9x97,1)/1133)) = ca 1,64
Skillnaden mellan de båda undersökningarna behöver ha varit minst 1,64 procentenheter för att förändringen ska räknas som statistiskt säkerställd.
5% - 2,9% = 2,1% Skillnaden var alltså 2,1 procentenheter, vilket är mer än 1,64 procentenheter, således kan man säga att förändringen är statistiskt säkerställd.
Felmarginalen för procenttalen, p1 och p2, i de båda undersökningarna (5% resp. 2,9%) räknas ut ungefär så här:
(en formel som endast kan användas då man har samma typ av standardavvikelse på de båda stickproven)
1,96 x roten-ur(p1(100-p1)/n1 + p2(100-p2)(n2) =
1.96 x roten-ur((5x95/1058)+((2,9x97,1)/1133)) = ca 1,64
Skillnaden mellan de båda undersökningarna behöver ha varit minst 1,64 procentenheter för att förändringen ska räknas som statistiskt säkerställd.
5% - 2,9% = 2,1% Skillnaden var alltså 2,1 procentenheter, vilket är mer än 1,64 procentenheter, således kan man säga att förändringen är statistiskt säkerställd.
Bild: enligt gamla temat "en statistisk säkerställning och en kanelbulle, tack"
SvD, Sydsvenskan, HD ______________________________________________________________________________________________
Ovanstående inlägg är direkt inspirerat av Skogsmannen: "Träffar hos mig", där han nämner vad folk googlar på för sökfras när de hittar till hans blogg, bl a "mannen som grubblade", samt "överleva en natt i skogen", och av Sentioergosum-Daniel, där han funderar över alla som söker på "Jennifer Aniston" när de hamnar hos honom.
Här på Z- enkla bloggen, är det, förutom ett gammalt inlägg med bilder på tigerungar (från början avsett för att locka besökare!), främst "statistiskt säkerställd", "hur många sekunder på ett dygn" (detta inlägg) (följt av "katolsk biskop", tror jag) som gäller som ingång.