Variasjon gjør at verden aldri blir kjedelig, og at statistikere aldri blir arbeidsledige.
Da eldstedattera nærmet seg to år, sto hun i stua hos foreldrene mine og så omtrent denne utsikten:
Hun hadde akkurat lært seg forskjellen på stor og liten, og gestikulerte frenetisk mens hun løp frem og tilbake foran vinduet og pekte vekselsvis på Tustnaferga på den andre siden av sundet, og bestefars lille hvite båt ved brygga. Hun rettet først en dirrende pekefinger mot den store ferga og ropte med dyp stemme -TOJE BÅTEN!!, deretter mot den lille båten og pep med pipestemme *litten-båten!!* Frem og tilbake: -TOJE BÅTEN!! *litten-båten!!* *litten-båten!!* TOOOJE BÅTEN!!
Ikke rart hun var begeistret: Hun var nesten to år og hadde oppdaget variasjon.
En stor del av jobben til statistikere er å studere variasjon. Vi beskriver variasjon på mange forskjellige måter, avhengig av hva slags type informasjon vi har:
* Farger: 3 røde, 4 oransje, 4 rosa, 5 gule.
* Båtstørrelse: Mellom 17,5 fot og 223 fot.
, og hva som er problemstillingen vår:
* Hvor mange forskjellige farger har juletrelys?
* Hvor stor andel av fritidsbåtene er maks 5 meter lange?
* Hvor bred må brygga på et fergetillegg være?
I statistiske tabeller vil vi derfor finne ulike tall for variasjon. Noen ganger får vi vite antallet i ulike kategorier,
noen ganger får vi vite minimumsverdien og maksimumsverdien, noen ganger kvartilene, og noen ganger oppgis standardavviket. De av dere som falt av på kvartiler kan prøve å lese dette blogginnlegget. Men både kvartilene og standardavviket skal jeg strikke i rikt monn senere.
Bildet under viser variasjon ved hjelp av et såkalt boksplott:
, og dette viser variasjon slik det uttrykkes med en normalfordeling (gaussfordeling):
Målet er at minst to av dere etter hvert skal bli like begeistret for statistisk variasjon som hun med båtene.