Primära och sekundära data

Språkbruket beträffande primära och sekundära data kan ibland vara förvirrande. Här reder vi ut begreppen och diskuterar hur du kan förhålla dig till primära och sekundära data, var du kan hitta dem, samt för- och nackdelar med att använda sig av dem.

Primär- och sekundärdata

En viktig indelning av de data, d.v.s. den empiri som uppsatsen slutsatser baseras på, är primärdata och sekundärdata. Denna indelning är kopplad till utredaren/forskaren: Primärdata är information som utredaren själv samlar in, medan sekundärdata är uppgifter som redan existerar och som någon annan samlat in.

Hur sekundära data kan vara till hjälp

Sekundära data kan vara till hjälp på olika sätt. Genom dem kan du t.ex. få hjälp med att

  • visa att hela eller delar av det valda utredningsproblemet redan finns behandlat (och kanske t.o.m. löst).
  • formulera utredningsproblem och att hitta "poänger" värda att utreda
  • hitta variabler som visat sig viktiga vid liknande undersökningar
  • få information om lämpligheten hos en tänkbar utredningsmetod
  • få förslag på konkreta frågor man kan ställa och hur svarsalternativ kan utformas
  • se hur andra undersökningar analyserat data -- fördelar och nackdelar med olika kvalitativa och kvantitativa analysmetoder
  • få tips om andra utredningar, som den egna utredningens teori, metod och resultat kan jämföras med.

Sekundärdata av olika slag

Av ovanstående följer att sekundära data kan vara av olika slag. De kan t.ex. utgöras av "fakta" som redovisar data om företagen i en bransch, eller data som direkt kan användas i den egna utredningen. Det kan vara "teori" i form av tillämpningar av teoretiska modeller eller helt tillämpade modeller för ett visst utredningsproblem. Men det kan också vara annan information som är användbar om metoder, operationaliseringar m.m.

Utgå från att utredningar redan finns inom ditt område

Många utredare missbedömer tillgången på redan existerande relevant information som kan tas tillvara i den egna utredningen. Det vanliga påståendet "det finns ingenting skrivet inom mitt utredningsområde" visar sig nästan alltid vara felaktigt.

En sådan felaktig slutsats kan ha olika förklaringar. Ett par vanliga exempel:

  • Utredaren kan inte se de samband som finns mellan det egna problemet och de redan publicerade forskningsresultat som han/hon har hittat.
  • Utredaren har otillräcklig kunskap om informationssökning och hittar således inte fram till relevanta källor. Oftast finns det mer information tillgänglig än vad man tror. Det gäller alltså att kunna sitt utredningsområde så väl att man vet, eller kan gissa, vilka relevanta källor som finns. Det gäller också att behärska sökteknik och källkritik.

Exempel på källor för sekundära data

  • Böcker: kursböcker, avhandlingar, handböcker m.m.
  • Tidskrifter: vetenskapliga, populärvetenskapliga, branschtidskrifter.
  • Tidningar: dagstidningar, affärstidningar, personaltidningar.
  • Nyhetsbrev.
  • Årsredovisningar, företagsrapporter, konsultrapporter.
  • Webbplatser på Internet: uppslagsböcker, bibliotek, företag, organisationer, databaser.
  • Sociala media av olika slag; bloggar, twittrar m.m.
  • Kurslitteratur kan vara intressant och ha bra hänvisningar.
  • Kommersiella utredningsföretag säljer information av varierande värde.
  • Tidigare examensarbeten är en bra källa för information. Åtskilliga är nåbara via Internet. Kvaliteten kan dock variera.

Mycket information är nåbar via Internet, särskilt om man är uppkopplad till nätet vid universitet eller högskola.

Fördelar med sekundära data

Några fördelar med sekundära data:

  • Stora besparingar i tid och kostnad. Stora mängder information är tillgängliga via Internet och/eller bibliotek - ofta gratis. Man kan som utredare kosta på sig att prova olika angreppssätt.
  • Tidigare utredningar kan ge värdefulla tips om hur bra eller mindre bra utredningar kan genomföras.

Nackdelar med att använda sekundära data

Några nackdelar med sekundärkällor och -data:

  • Det finns alltid en risk att man som utredare frestas att använda material, inte för att det är av hög kvalitet utan för att det är lätt tillgängligt. Det är utredningsproblemet som ska styra valet av information -- inte tvärtom.
  • Den befintliga informationen kanske inte passar så bra som det från början verkar. Definitioner kan vara annorlunda, bortfallet kan vara allvarligt.
  • Om man måste betala för data från sekundärkällor kan det visa sig billigare att samla in själv (om man har tid).
  • Man kan som utredare få ta ansvar för felaktigheter i sekundärkällor utan att ha haft kontroll över den ursprungliga utredningen.
  • Sekundära data kan visa sig komma från "tertiärkällor", d.v.s. den källa man som utredare använder kan i sin tur visa sig bygga på andras sekundära data. Utgå ifrån att information förvanskas när den passerar flera led.

Primära data

Primära data är det som de flesta använder som empiri i sin uppsats. När du är ute och

  • samlar in enkäter
  • gör intervjuer; fokusgrupp, telefon, per brev/e-post
  • observerar.

Det kallas primära data för att det är du själv som samlar in och tolkar – till skillnad från sekundära data som är inhämtat av någon annan.

Informationsdistans - en tankefigur

Avslutningsvis vill vi ge dig en tankefigur för hur du kan tänka kring kvalitetsaspekter vad gäller primära och sekundära data. Vi kallar tankefiguren för "Informationsdistans" och kan definieras som avståndet mellan producenten och användaren (konsumenten) av information. Ju kortare avstånd, desto bättre kvalitet. 

Faktorer som kan påverka informationsdistansen:

  • Tid -- avstånd mellan händelse och användning. Ju längre tid mellan själva händelsen och netecknandet, desto sämre kvalitet. Exempel: Memoarer som inte bygger på samtida dagboksanteckningar är ofta otillförlitliga.
  • Rum -- geografiskt avstånd. Med geografiskt avstånd följer ofta skillnader i kultur, många kopplingspunkter på vägen, risk för brus.
  • Mentalt -- avstånd i kultur, språk, religion o.s.v.. Exempel: Hur säker kan man vara på uppgifter som översatts från en annan kultur och ett annat språk?
  • Länkar -- hur många kopplingspunkter passerar informationen? Ju färre länkar destor högre kvalitet. Primärkällor är således bättre än sekundär- och tertiärkällor.
  • Brus --  vilka fel kommer till, vilka korrekta informationsbitar försvinner? Olika informationskanaler och uppgiftslämnare har olika kvalitet.

Hur kan man minska informationsdistansen och på så sätt öka kvaliteten? Grundprincipen är att försöka komma så nära informationsproduktionen som möjligt, d.v.s. helst använda primära data. Och tänk på att all information är producerad av någon och därför knappast kan anses som objektiv!