Sådan beregnes gennemsnittet af en liste - Statistik og Pythons gennemsnitlige funktion forklaret i detaljer

Matematik og programmering går hånd i hånd. Hvis du er programmør, skal du på et tidspunkt bruge matematik.

Datalogi, maskinindlæring, kunstig intelligens og kryptokurver er alle baseret på komplekse underliggende matematiske principper.

Brug af matematiske funktioner behøver dog ikke at være kompliceret! Python abstraherer alt væk, så når du først har forstået begreberne, behøver du ikke forstå de fulde detaljer i implementeringen.

Matematik behøver ikke at være skræmmende

Der er mange matematiske funktioner, du vil støde på. Hvis du arbejder med data eller analyse, er det vigtigt, at du forstår nogle matematiske principper og funktioner.

En sådan funktion, du skal forstå, er meanfunktionen.

Lad være med at blive afskrækket med navnet - der er intet middel (ordspil beregnet) ved meanfunktionen i Python.

Dette indlæg er selvstændigt, men jeg forventer, at du har en vis erfaring med at arbejde med Python, og at du ved, hvad en Python-liste er. Hvis ikke, skal du tjekke denne artikel, inden du går videre.

Når du er færdig, kom tilbage og kom med mig til et dybt dyk ind i meanfunktionen.

Statistikker

Så du vil lære mere om meanfunktionen. Det er fantastisk! Men før vi ser på denne funktion, er det vigtigt at se på den disciplin, den stammer fra: statistik.

På billedet ovenfor ser vi en graf. En graf er en billedrepræsentation, der viser forholdet mellem en variabel i forhold til en anden.

Grafer er nyttige, fordi de giver os mulighed for at organisere data, så vi hurtigt kan se tendenser og forhold mellem dataene. En graf er kun et værktøj, som vi kan bruge til at visualisere og analysere data.

Statistik er en gren af ​​matematik, der giver os mulighed for at have en systematisk måde at klassificere, analysere og fortolke data på. Dette er vigtigt, for med statistik har vi en samling færdige værktøjer til at gøre hver af disse ting.

Forestil dig, hvis du har brug for at genopfinde en sav hver gang du har brug for at skære et stykke træ. Vi ville mange mennesker kalde sav med forskellige navne, selvom de gør det samme. For at undgå dette problem gav vi saven et navn, som alle kan henvise til den ved.

Det samme sker i statistikker - vi har kendte værktøjer, som alle er fortrolige med. Et sådant værktøj er middelværdien.

Mode, median og gennemsnit

Selvom middel er perfekt i stand til at stå alene, undervises det normalt som en del af en trio, som inkluderer tilstanden, medianen og middelværdien.

Lad os se på en gruppe af tal, så du forstår, hvad der sker her. Forestil dig, at du har nedenstående numre:

1, 2, 3, 3, 4, 6, 9

Sig, at vi ville udtrykke, hvilket nummer der forekommer flest gange. Det ville være 3, og det navn, vi giver denne egenskab, er tilstand. Tilstanden er det nummer, der er hyppigst i et sæt, vi undersøger.

Nummeret i midten af ​​et bestilt sæt kaldes medianen. For at finde medianen for et numerisk sæt skal du arrangere tallene fra mindste til største og derefter se på tallet i midten. Sættet med tal ovenfor er allerede arrangeret fra mindst til størst, så mediannummeret er også 3.

Endelig er middelværdien en anden måde at henvise til gennemsnittet af sættet. For at finde middelværdien skal du bare tilføje alle numrene sammen og dele det med det samlede antal elementer i sættet. I tilfældet med tallene ovenfor får vi 28, hvis vi tilføjer dem alle sammen. Det samlede antal poster i sættet er 7, så vores gennemsnit er 4.

Hvorfor har vi brug for gennemsnittet?

Så på dette tidspunkt undrer du dig måske over, hvorfor vi alligevel skal finde gennemsnittet af et tal.

Sagen er, selv statistikken i sig selv er opdelt i flere grupper. Ligesom du har værktøjer, der bruges til at arbejde med træ og andre til at arbejde med metal, grupperes nogle værktøjer i statistikker i klasser, da de bruges til et lignende formål.

En sådan gruppe i statistikker kaldes oversigtsstatistik. En af de ting, statistikker bruges til, er at beskrive data, og resuméstatistik er en samling værktøjer, der bruges til dette formål. En af genstandene i denne klasse af værktøjer er middelværdien.

Gennemsnittet er vigtigt på grund af at hjælpe os med at analysere, hvad der er kendt som en distribution. I statistikker er en distribution en metode, vi bruger til at se på en variabel, vi ønsker information om. Ved hjælp af en distribution vil vi se på værdierne for denne variabel, og hvor ofte den forekommer.

Hvis vi indsamler data, er en almindelig distributionstype, vi ser, den normale fordeling, der har form af klokkekurven:

Det vil sige, at variablen vil have en fælles værdi, som den har tendens til, såvel som et startpunkt og et slutpunkt.

Hvad betyder det er, at det giver os mulighed for at tage en distribution som denne og se på den centrale tendens for variablen, som er det punkt, hvor værdierne af variablen har tendens til at klynges.

Således kan vi sige, at middelværdien beskriver distributionens centrale tendens.

Beregning af middelværdien i Python

Vi kan manuelt beregne middelværdien, hvis vi har et lille numerisk datasæt, har vi et par værdier at arbejde med. Men når vi har hundreder eller tusinder af værdier i et datasæt, bliver det umuligt at beregne det manuelt.

Da Python er et "batterier inkluderet" -sprog, er den måde, vi kan gøre dette på, at bruge meanfunktionen af ​​statistikmodulet i Python.

Lad os bruge meanfunktionen til at beregne gennemsnittet af det numeriske datasæt, vi havde tidligere i posten:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Kodeløse datastrukturer og algoritmer - Lær DSA uden at skrive en enkelt kodelinje | Armstrong Subero | Apress Denne bog giver dig et nyt perspektiv på algoritmer og datastrukturer, helt kodefri. Lær om datastrukturalgoritmer (DSA'er) uden nogensinde at skulle åbne din kodeditor, bruge en compiler eller se på et integreret udviklingsmiljø (IDE) .... Armstrong Subero Søgemenu Indkøbskurv V Din indkøbskurv er i øjeblikket tom. Login konto Bogreol Login Apress Access