Store data (Big Data) kan gi samfunnskunnskap med et presisjonsnivå vi aldri tidligere har hatt.
Tilliten til valgmålinger fikk sin alvorligste knekk med brexit og Trump. Målingene gjøres som surveyundersøkelser, en utbredt metode i samfunnsforskning.
Metoden kan ha store målefeil, noe som fremkom da General Social Survey, en av USAs mest anerkjente, undersøkte heterofile samleier og prevensjonsbruk.
En liten regnedjevel tok for seg rapporten og beregnet hva tallene måtte medføre av kondombruk. Han fant at kvinnenes svar krevde 1,1 milliarder kondomer pr. år, mens mennenes krevde 1,6 milliarder.
Så hvilket kjønn løy?
Begge. Fordi regnedjevelen også fant at det faktiske kondomkonsumet var på skarve 600 millioner.
Mennenes løgn var bare drøyere enn kvinnenes, men alle løy.
Ny teknologi, nye metoder
Det spørs om surveyundersøkelsene snart kan ri inn i solnedgangen, fordi ny teknologi gir oss nye metoder til å finne den informasjonen vi tidligere har brukt slike undersøkelser til å finne.
Store data (Big Data) er generert på nye måter, har andre kvaliteter, og ny teknologi gir oss større analysekraft. Nå kan forskere i større grad avsløre at vi lyver og hvordan vi lyver.
Økonomen Seth Stephens-Davidowitz har tatt doktorgrad på store data og omtaler noe av de enorme, nye mulighetene i boken Everybody Lies. Big Data, New Data, and what the Internet can tell us about who we really are.
Her kan vi lese hvordan innrømmelser som hittil har vært forbeholdt den katolske skriftestolen, nå kan avleses anonymisert i store data.
I vår tid skaper vi falske glansbilder på Facebook og betror ærlig våre hemmeligheter til en hvit boks på dataskjermen. Der abort er forbudt søkes det etter metoder med kleshengeren. Der homofili er tabu søkes det etter homo-tester.
Informasjon om anger, arroganse, influensasymptomer og mye mer ligger med tetthet fordelt på tid, geografi og mer.
Dette kan gi samfunnskunnskap med et presisjonsnivå vi aldri tidligere har hatt.
Store data kan gi bedre verktøy
Da Trump vant, lette mange etter forklaringen.
Den geografiske fordelingen av Google-søkene med det eksplisitt ladde uttrykket «negervitser» (sic) ga best match med Trumps sterkeste valgkretser. Søkeordet avdekket et kart over amerikansk rasisme som først ble synlig med store data. Denne gang avgjorde disse strømningene det amerikanske presidentvalget.
De har også spilt en rolle ved tidligere valg, viste det seg.
Rasismekartet matchet områdene der Obama gjorde det markert svakere enn John Kerry fire år tidligere. Stemmeforskjellen som man tidligere, uten hell, hadde forsøkt å finne årsaken til, er nå forklart. Man fant også hvor stor effekten var: Selv om Obama vant, tapte han likevel 4 prosentpoeng nasjonalt på å være farget.
Store data kan gi oss bedre verktøy på en rekke områder; medisin, klima, politikk, kriminalitetsforebygging, mv. Verden er sammensatt. Også samfunnsforskere har – og vil – konkludere feil, men kanskje mindre fremover?
Søkefeltene er vår tids anonyme skriftestol. Sammen med ny teknologi kan de være en kilde til å forstå hvem vi er, hvor vi er på vei og hva vi bør gjøre med det.
Artikkelen ble publisert i Aftenposten den 4. september 2017 her: https://www.aftenposten.no/meninger/debatt/i/g8p89/Sokefeltene-er-var-tids-anonyme-skriftestol–Helle-Stensbak