Innehållet på en Facebook-sida. Mitten av diagrammet representerar alla inlägg i tidsordning, vänster sida är ett nätverk av användare som interagerar med dem och den högra sidan är ett nätverk av ord som visas i dem.
Samtidigt som folk i olika industrier febrilt samlar digital data såsom patientförteckningar, inlägg på sociala medier, bilder, feedback, internetöverföringar och rörelseregister finns ett brådskande behov att tänka om angående hur data hanteras och analyseras. En stor del av denna data begripliggörs genom användandet av automatiserade beräkningsprocesser som algoritmer, maskininlärningar och statistiska procedurer där mänskliga experter bara övervakar eller "tränar" programmen att hitta mönster i datan. Det här resulterar i väldigt dunkla system som pressar in folk i kategorier eller ger dem ojämn åtkomst till service (sjukvård, lån, försäkringsbrev eller jobb) medan systemens grundfunktioner fortsätter att vara otillräkneliga och ofta obegripliga för användarna. Den populära kommentatorn Cathy O’Neil har till och med kallat dem "vapen för matteförstörelse".
Kvalitativa forskare, antropologer och filosofer har återkommande klagat på att dessa metoder för dataanalys är reduktiva och misslyckas med att fånga komplexiteten av levd erfarenhet. De har visat hur folk frekvent faller mellan stolarna hos algoritmiskt tilldelade kategorier eller försöker manipulera deras mätvärden. De har argumenterat att dessa typer av analyser innehåller alla sorters antaganden och omdömen som döljs under ett objektivitetens språk, men ändå har brett spridda politiska och etiska konsekvenser. Dessa forskare har dock sällan föreslagit alternativa sätt att analysera data i skala.
Visualiseringar som forskningskartor
Nya typer av datavisualiseringar har potential att representera komplex data utan onödig reduktion eller aggregation, vilket öppnar för möjligheten att digital data skulle kunna analyseras på mer förklarande och utforskande sätt. Dessa visualiseringar skulle kunna läsas som kartor som visar osäker terräng – som en läkare betraktar en MRI-skanning av en hjärna – i stället för att användas för att övertyga oss om korrelationer och kvantiteter eller förklara relationen mellan smalt definierade variabler. Sådana tekniker skulle kunna tillåta utövare att ställa bredare frågor om sina data, problematisera sina datakällor och mätsystem samt tillåta mer givande samarbeten med forskare från andra discipliner. Dessa möjligheter för forskning kompliceras dock ofta av att de faller mellan olika discipliner och traditioner för så kallad ”kvantitativ” och ”kvalitativ forskning”.
Ett områdesgraf för referenser som används i en Wikipediaartikel, färgad efter typ.
Samarbeten inom olika fält
Jag åtar mig för närvarande en serie av samarbeten med dataforskare och programmerare i olika fält för att lära mig om hur dessa disciplinära och metodologiska spänningar tar sig uttryck i praktiken och hur alternativa sätt av dataanalys kan vara möjliga. För närvarande arbetar jag med utövare i epidemiologi, sportdata och regeringsstatistik samt experimenterar med dessa nya former av visualisering och analys. Jag leder även relaterad forskning om dataanalysens inverkan på politiska kampanjer och undersökningar samt den ökade viljan att mäta och ranka akademier och institutioner, också genom digital data.