Gut, machen wir weiter mit unseren Daten. Nachdem wir uns diese im Projekt 1 einmal angesehen haben, wollen wir mit diesen einige Dinge, welche ich in den Grundlagen vorgestellt habe, an den Livedaten anschauen.
Die Daten sind die identischen aus dem Projekt 1.
Vorbereitungen
Zu Beginn importieren wir die benötigten Bibliotheken. Dies sind pandas und numpy. Wie gewohnt machen wir dies mit:
import pandas as pd
import numpy as np
Bevor wir weitermachen, ist eine Überlegung. Für welche Spalte mach es überhaupt Sinn sich näher zu beschäftigen.
Die Spalte „date“ stellt lediglich die Daten dar. Hier macht es nicht viel Sinn.
Die Spalte „sales“ stellt die Umsätze zu den Daten dar. Hier können wir doch prima beginnen. Aber davor müssen wir noch ein wenig aufräumen, denn die Spalte „unnamed“ stört.
Die erste Spalte in einem Dataframe werden mit:
df.drop(columns=df.columns[0], inplace=True)
entfernt.
- df -> hier wird das dataframe names „df“ angesprochen
- drop -> ist die Methode, welche das Entfernen definiert
- columns=df.columns[0] = definiert die erste(!) Spalte. Bitte beachten, dass in python mit der 0 zu zählen begonnen wird.
So jetzt haben wir die Daten bzw. das Dataframe vorbereitet.
Endlich – der Mittelwert
Zur Auffrischung der Mittelwert berechnet sich im einfachen Fall aus der Summe der Reihenwerte dividiert durch die Anzahl der Werte der Zahlenreihe. In unserem Fall ist die Zahlenreihe die Spalte „sales“.
Als Code sieht dies so aus:
mean_ = df["sales"].mean()
- mean_ -> beschreibt die Variable, welche den Mittelwert speichert
- df[„sale“] -> definiert die Spalte „sales“
- mean() -> ist die eigentliche Methode, welche den Mittelwert berechnet
- mit dem Befehl print wird der Mittelwert nun ausgegeben.
Im ganzen sieht der Code wie folgt aus:
Und da ist er! Der Mittelwert der Spalte „sales“ beträgt: „419344.5511158798“
Das heißt, wenn die einzelnen Datenpunkte aus der Spalte „sales“ gleichmäßig auf die einzlenen Daten(Plural von Datum) verteilt wären. Jedes Datum eine Sales-Wert von „419344.5511158798“ aus macht.
Ist das nicht wunderbar?! Achtung Spoiler!
Nein ist es nicht. Die Aussagekraft ist gleich Null.
Warum, dazu hier im nächsten Post.
Euer fux
2 thoughts on “Projekt 1.1 – Der Mittelwert Teil 1”