Empirisk variabilitet

Med udgangspunkt i de beregnede gennemsnit kan man beregne et observeret/empirisk mål for variabiliteten i meningsmålingerne.
Præcis som for gennemsnittene benyttes den enkelte målings frekvensvægt, yderligere vægtes hver observation med alderen så gamle observationer vægtes mindre end nye observationer. Den konkrete formel for variabiliten er:
Standard afvigelse  = \sqrt{\cfrac{\sum_{m \in M}{|m|\cdot (v_p - g_p)^2}}{|M|}}
Hvor p er et parti, m er den enkelte måling, M er samlingen af målinger, |\cdot| er vægten, v_p er værdien fra meningsmålingen for partiet og g_p er det seneste gennemsnit af målinger for partiet forinden hver meningsmåling.
Dette mål for den observerede/empiriske variabilitet i meningsmålingerne er forskelligt fra den estimerede/statistiske usikkerhed, som er baseret på en sandsynlighedsmodel (multinomial fordelingen), som bruges til at beskrive situationen ved meningsmålinger.
Den estimerede/statistiske usikkerhed er alene baseret på sandsynlighedsmodellen samt det enkelte partis stemmeprocent.
I modsætning dertil er den observerede/empiriske variabilitet et udtryk for usikkerheden som observeret i form af de meningsmålinger, som indgår i gennemsnittene. Men pga. beregningsmetoden, så er denne Standard afvigelse (den orange søjle nedenfor) behæftet med usikkerhed – præcis som gennemsnittet af meningsmålingerne.

Da gennemsnittet fastholdes i perioderne imellem hver ny beregning af gennemsnit, så kan en markant udvikling i et partis støtte føre til en forhøjet beregnet Standard afvigelse. Denne effekt kan ses tydeligt for Socialdemokraterne og Enhedslisten i perioden op til d. 1/7-2012:

Bemærk hvordan Venstre på trods af en markant højere Stemmeprocent, og dermed højere estimerede/statistiske usikkerhed, end både Socialdemokraterne og Enhedslisten, men både Socialdemokraterne og Enhedslisten har en markant højere Standard afvigelse.

Samlet betyder det at en forhøjet Standard afvigelse er udtryk for enten

  • en høj usikkerhed om støtten til det enkelte parti, eller
  • en tendens i udviklingen i støtten til partiet.

Begge er tegn på en forøget usikkerhed i de fremtidige meningsmålinger relativt til gennemsnittet af de seneste meningsmålinger.

Hvis man vil estimere et 95% konfidensinterval på samme måde som man gør med den estimerede/statistiske usikkerhed, så kan man beregne det som Gennemsnit \pm 2 \cdot Variabilitet.

For Venstres data fra d. 1/7-2013 betyder det:
Estimeret konfidensinterval  = \begin{bmatrix}33.69 - 2\cdot 1.02 & ; & 33.69 + 2 \cdot 1.02\end{bmatrix} = \begin{bmatrix}31.65 & ; & 35.73\end{bmatrix}.
For Socialdemokraternes data fra d. 1/7-2013 betyder det:
Estimeret konfidensinterval  = \begin{bmatrix}17.75 - 2\cdot 2.20 & ; & 17.75 + 2 \cdot 2.20\end{bmatrix} = \begin{bmatrix}13.35 & ; & 22.15\end{bmatrix}.

Beregnet med de samme data ud fra den estimerede usikkerhed på basis af 1000 deltagere i målingen fås:
For Venstres data fra d. 1/7-2013 betyder det:
Estimeret konfidensinterval  = \begin{bmatrix}33.69 - 2.90 & ; & 33.69 + 2.90\end{bmatrix} = \begin{bmatrix}30.79 & ; & 36.59\end{bmatrix}.
For Socialdemokraternes data fra d. 1/7-2013 betyder det:
Estimeret konfidensinterval  = \begin{bmatrix}17.75 - 2.40 & ; & 17.75 + 2.40\end{bmatrix} = \begin{bmatrix}15.35 & ; & 20.15\end{bmatrix}.

Bemærk at den empiriske variabilitet (4.40) er nærmest dobbelt så stor for Socialdemokraterne som den estimerede usikkerhed (2.40), mens det for Venstre er den empiriske variabilitet (2.04) som er mindre end den estimerede usikkerhed (2.90). Den forhøjede variabilitet for Socialdemokraterne skyldes til dels den markante tendens i deres andel af stemmerne i perioden op til d. 1/7-2012.

Kilder: Meningsmålinger udført af Epinion for DR, TNS Gallup for Berlingske, Greens Analyseinstitut for dagbladet Børsen, Megafon for TV 2 og Politiken, Rambøll/Analyse Danmark for Jyllands-Posten, Voxmeter for Ritzaus Bureau og YouGov for metroXpress.