Farger og blomster hjelper mot alt!
Det eneste jeg har bedrevet av statistikk de siste par ukene er å hoste statistiske råd i øret på dem som har ringt til meg. Alt annet har til min store frustrasjon blitt avlyst og utsatt – inkludert blogginnlegg med statistisk innhold. Til gjengjeld har jeg strikket som besatt. Men nå får det være nok! Virusene har blitt bekjempet samtidig som regnbueskjerfet har vokst, og nå er statistrikkeren tilbake for fullt. På skjerfet gjenstår bare pynten. Hoho, det kommer til å bli så fint! For se så lekkert det er allerede:
Omtrent samtidig som siste maske ble felt av på regnbueskjerfet, dukket det opp et samstrikkprosjekt jeg falt fullstendig for. Tori Seierstad som står bak torirotdesign har satt i gang et herlig lappeteppeprosjekt der vi skal strikke en blomstereng. For en fantastisk idé! Teppet er et langtidsprosjekt, og det er bare vårblomstene som er klare ennå.
Da jeg fikk Toris tillatelse til å vise frem vårblomstbildene, klarte jeg ikke å la være å benytte sjansen til å få klemt inn litt statistikk også. Jeg som jobber som dere vet både med studentundervisning og veiledning av medisinske forskere, og er kronisk nysgjerrig på hvilken undervisning som fungerer, og hva det daglige arbeidsliv egentlig trenger av statistikkunnskap. Jeg tror jeg har ganske god peiling på begge deler, men nettopp derfor er det morsomt å høre om det stemmer. Strikkende statistiker spør derfor:
Hva er ditt beste minne fra statistikkundervisningen på studiet, og hva slags statistisk kunnskap har du hatt mest bruk for i arbeidslivet?
Og strikkende lege svarer:
Statistikkundervisningen var jo veldig lenge siden… men jeg likte Bayes teorem. I arbeidslivet..? Dette med sensitivitet og spesifisitet er jo viktig å ha en viss forståelse for, samt pretest og posttest sannsynlighet. Og det henger vel litt sammen med Bayes, gjør det ikke, på en måte?
Så gøy! Bayes, faktisk! Jeg er hjertens enig, Bayes er gøy. Dette er Bayes:
For det første er det en formel som gjør oss i stand til å «snu» sannsynlighetsberegninger. Sannsynligheten for at du er syk selv om testen sier at du er frisk kan beregnes ut i fra sannsynligheten for at testen sier at du er frisk (eller syk) når du faktisk er syk (eller frisk). Haha, det ser ikke særlig mye lettere ut, det skal jeg innrømme, men denne snuingen av betingede sannsynligheter kan være selve nøkkelen til å finne svaret.
For det andre betegner det en statistisk tankegang der vi tar hensyn til det vi vet fra før når vi gjør beregninger. Jeg vet for eksempel hvor de første hestehovene og hvitveisene vanligvis kommer, og hvordan snøsmeltingsstatusen, kalendertiden og temperaturen er når de tidligste eksemplarene klemmer seg opp av jorda. Dermed tar jeg alt det i betraktning før jeg begynner å tråle grøftekantene eller skogbrynet etter dem.
Fordi jeg bruker forhåndskunnskapen aktivt, vil jeg si at jeg tenker som en bayesianer når jeg leter etter vårblomster. De fleste av oss gjør det, helt uten at vi er klar over det. Inne i hjernen vår foregår slike beregninger ustanselig: Vi tar utgangspunkt i det vi vet og oppdaterer dette med det vi observerer.
Utfordringen til statistikere som skal gjøre bayesianske beregninger er at vi først skal oversette all forhåndskunnskapen til tall, og deretter oppdatere dette etter hvert som nye observasjoner strømmer inn.
La oss ta hestehoven som eksempel: Jeg har en formening om hvordan vær, føre og dato er når hestehoven kan observeres, men hvis jeg flytter til et annet sted (eller klimaforandringene slår inn for fullt), justerer jeg mine forventninger etter hvert som vårene går, og jeg lærer meg de lokale forholdene.
Eller strikking: For ti år siden hørte det med til sjeldenhetene at jeg strikket ferdig en genser, og forventningen om at jeg skulle strikke et helt lappeteppe var svært lav. Nå vet jeg at jeg er i stand til å strikke en genser på en uke, og da vil kanskje et lappeteppe være mulig også. (Beregningene mine justerer seg også her etter hvert som jeg erfarer nye ting.) Blomsterlappeteppet er jeg imidlertid usikker på, for jeg har aldri strikket et teppe før, og jeg er ikke så flink til å følge oppskrifter. Men hestehoven var ganske rask å strikke. Jeg måtte selvsagt gjøre noe annet enn oppskriften allerede i lapp nummer 1, og klønet litt for å få det til, men nå ligger det en lysende gul tussilago farfara i sofaen ved siden av meg.
Den bayesianske lappeteppeberegningen som gjøres inne i hjernen min har altså bortsett fra mine generelle strikkeerfaringer, bare denne ene lappen å gå på, og det gjør at det blir stor usikkerhet i sluttresultatet. Men jeg er optimistisk, og kommer til å oppdatere mitt bayesianske teppeanslag etter hvert. Det blir lagt ut mønster på totalt fem blomster i april. Neste bukett kommer i juni, sier Tori. (Jeg slenger umiddelbart denne opplysningen inn i beregningen min, som den ekte bayesianeren jeg er.)
Hiv deg på du også!