Datatyper i statistik - Nominelle, ordinære, interval- og forholdsdatatyper forklaret med eksempler

Hvis du studerer til en statistisk eksamen og har brug for at gennemgå dine datatyper, giver denne artikel dig en kort oversigt med nogle enkle eksempler.

For lad os indse det: ikke mange mennesker studerer datatyper for sjov eller i deres virkelige hverdag.

Så lad os dykke ind.

Kvantitative vs kvalitative data - hvad er forskellen?

Kort sagt: kvantitativ betyder, at du kan tælle det, og det er numerisk (tænk mængde - noget du kan tælle). Kvalitativ betyder, at du ikke kan, og det er ikke numerisk (tænk kvalitet - kategoriske data i stedet).

Boom! Simpelt, ikke?

Der er endnu en skelnen, som vi skal få lige før vi går videre til de faktiske datatyper, og det har at gøre med kvantitative (tal) data: diskrete versus kontinuerlige data.

Diskrete data involverer heltal (heltal - som 1, 356 eller 9), der ikke kan opdeles ud fra arten af, hvad de er.

Ligesom antallet af personer i en klasse, antallet af fingre på dine hænder eller antallet af børn, som nogen har. Du kan ikke have 1,9 børn i en familie (på trods af hvad folketællingen måske siger).

Kontinuerlige data er derimod det modsatte. Det kan opdeles så meget som du vil og måles til mange decimaler.

Ligesom bilens vægt (kan beregnes til mange decimaler), temperatur (32,543 grader osv.) Eller et flys hastighed.

Nu til de sjove ting.

Kvalitative datatyper

Nominelle data

Nominelle data bruges til at mærke variabler uden nogen kvantitativ værdi. Almindelige eksempler inkluderer mand / kvinde (omend noget forældet), hårfarve, nationaliteter, navne på mennesker osv.

På almindelig engelsk: dybest set er de mærker (og nominelle kommer fra "navn" for at hjælpe dig med at huske). Du har brunt hår (eller brune øjne) . Du er amerikaner . Dit navn er Jane .

Eksempler:

Hvilken farve hår har du?

  • Brun
  • Blond
  • Sort
  • Rainbow enhjørning

Hvad er din nationalitet?

  • amerikansk
  • tysk
  • Kenyansk
  • Japansk

Bemærk, at disse variabler ikke overlapper hinanden. Med henblik på statistik kan du alligevel ikke have både brunt og regnbue enhjørning-farvet hår. Og de er kun virkelig beslægtede efter hovedkategorien, som de er en del af.

Ordinære data

Nøglen med ordinaldata er at huske, at ordinal lyder som orden - og det er rækkefølgen af ​​variablerne, der betyder noget. Ikke så meget forskellene mellem disse værdier.

Ordinære skalaer bruges ofte til målinger af tilfredshed, lykke osv. Har du nogensinde taget en af ​​disse undersøgelser, som denne?

"Hvor sandsynligt er det, at du anbefaler vores tjenester til dine venner?"

  • Meget sandsynligt
  • Sandsynligvis
  • Neutral
  • Usandsynlig
  • Meget usandsynligt

Se, vi ved ikke rigtig, hvad forskellen er mellem meget usandsynligt og usandsynligt - eller om det er den samme sandsynlighed (eller usandsynlighed) som mellem sandsynlig og meget sandsynlig. Men det er ok. Vi ved bare, at sandsynligvis er mere end neutral og usandsynligt, er mere end meget usandsynligt. Det hele er i orden.

Kvantitative datatyper

Intervalldata

Intervalldata er sjove (og nyttige), fordi det handler om både rækkefølgen og forskellen mellem dine variabler. Dette giver dig mulighed for at måle standardafvigelse og central tendens.

Alles foretrukne eksempel på intervaldata er temperaturer i grader celsius. 20 grader C er varmere end 10, og forskellen mellem 20 og 10 grader er 10 grader. Forskellen mellem 10 og 0 er også 10 grader.

Hvis du har brug for hjælp til at huske, hvad intervallskalaer er, skal du bare tænke på betydningen af ​​interval: mellemrummet mellem . Så ikke kun er du interesseret i rækkefølgen af ​​variabler, men også om værdierne imellem dem.

Der er dog et lille problem med intervaller: der er ikke noget "sandt nul". Et sandt nul har ingen værdi - der er ikke noget af det - men 0 grader C har bestemt en værdi: det er ret køligt. Du kan også have negative tal.

Hvis du ikke har et sandt nul, kan du ikke beregne nøgletal. Dette betyder addition og subtraktion, men division og multiplikation gør det ikke.

Forholdsdata

Gudskelov, der er forholdsdata. Det løser alle vores problemer.

Forholdsdata fortæller os om rækkefølgen af ​​variabler, forskellene mellem dem, og de har det absolutte nul. Hvilket gør det muligt at udføre og tegne alle mulige beregninger og slutninger.

Forholdsdata er meget lignende intervaldata, undtagen nul betyder ingen. For forholdsdata er det ikke muligt at have negative værdier.

For eksempel er højde forholdsdata. Det er ikke muligt at have negativ højde. Hvis et objekts højde er nul, er der intet objekt. Dette er anderledes end noget som temperatur. Både 0 og -5 grader er helt gyldige og meningsfulde temperaturer.

Nu hvor du har et grundlæggende håndtag på disse datatyper, skal du være lidt mere klar til at tackle den statistiske eksamen.