Skip to content

data-fux

Power BI aus dem Leben des data-fux

Menu
  • Startseite
  • Projekte
    • Kundensegmentierung – Projekt 2
    • Projekt 1
      • Projekt 1.1 Teil1
      • Projekt 1.1 Teil2
  • Statistik und mehr
    • Grundlagen
    • zentrale Tendenz
    • Modus
  • Python und mehr
  • Tools
  • der fux
    • Cookie-Richtlinie (EU)
    • Privacy Policy
Menu

Projekt 1.1 – Der Mittelwert Teil 1

Posted on 12. Oktober 202313. Oktober 2023 by der fux

Gut, machen wir weiter mit unseren Daten. Nachdem wir uns diese im Projekt 1 einmal angesehen haben, wollen wir mit diesen einige Dinge, welche ich in den Grundlagen vorgestellt habe, an den Livedaten anschauen.

Die Daten sind die identischen aus dem Projekt 1.

Vorbereitungen

Zu Beginn importieren wir die benötigten Bibliotheken. Dies sind pandas und numpy. Wie gewohnt machen wir dies mit:

import pandas as pd
import numpy as np

Bevor wir weitermachen, ist eine Überlegung. Für welche Spalte mach es überhaupt Sinn sich näher zu beschäftigen.

Die Spalte „date“ stellt lediglich die Daten dar. Hier macht es nicht viel Sinn.

Die Spalte „sales“ stellt die Umsätze zu den Daten dar. Hier können wir doch prima beginnen. Aber davor müssen wir noch ein wenig aufräumen, denn die Spalte „unnamed“ stört.

Die erste Spalte in einem Dataframe werden mit:

df.drop(columns=df.columns[0], inplace=True)

entfernt.

  • df -> hier wird das dataframe names „df“ angesprochen
  • drop -> ist die Methode, welche das Entfernen definiert
  • columns=df.columns[0] = definiert die erste(!) Spalte. Bitte beachten, dass in python mit der 0 zu zählen begonnen wird.

So jetzt haben wir die Daten bzw. das Dataframe vorbereitet.

Endlich – der Mittelwert

Zur Auffrischung der Mittelwert berechnet sich im einfachen Fall aus der Summe der Reihenwerte dividiert durch die Anzahl der Werte der Zahlenreihe. In unserem Fall ist die Zahlenreihe die Spalte „sales“.

Als Code sieht dies so aus:

mean_ = df["sales"].mean()
  • mean_ -> beschreibt die Variable, welche den Mittelwert speichert
  • df[„sale“] -> definiert die Spalte „sales“
  • mean() -> ist die eigentliche Methode, welche den Mittelwert berechnet
  • mit dem Befehl print wird der Mittelwert nun ausgegeben.

Im ganzen sieht der Code wie folgt aus:

Und da ist er! Der Mittelwert der Spalte „sales“ beträgt: „419344.5511158798“

Das heißt, wenn die einzelnen Datenpunkte aus der Spalte „sales“ gleichmäßig auf die einzlenen Daten(Plural von Datum) verteilt wären. Jedes Datum eine Sales-Wert von „419344.5511158798“ aus macht.
Ist das nicht wunderbar?! Achtung Spoiler!

Nein ist es nicht. Die Aussagekraft ist gleich Null.
Warum, dazu hier im nächsten Post.
Euer fux

2 thoughts on “Projekt 1.1 – Der Mittelwert Teil 1”

  1. Pingback: Projekt 1.1 - Der Mittelwert Teil 2 - data-fux
  2. Pingback: Kundensegmentierung - Projekt Nr. 2 - data-fux

Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Neueste Beiträge

  • Shit in – Shit out! Lasst uns vorher sprechen
  • Etwas Neues!
  • Kundensegmentierung – Ermitteln wir das R in der RFM Analyse.
  • Kundensegmentierung – Projekt Nr. 2
  • Der Modus in der Statistik

Neueste Kommentare

  • Kundensegmentierung - Projekt Nr. 2 - data-fux bei Projekt 1.1 – Der Mittelwert Teil 1
  • Projekt 1.1 - Der Mittelwert Teil 2 - data-fux bei Projekt 1.1 – Der Mittelwert Teil 1
  • Merkmale in der Statistik: Eine kleine Übersicht - data-fux bei Fangen wir an – der Mittelwert, oder alles ist gleich.
  • Zeitreihen in der Statistik: Eine Einführung - data-fux bei Projekt 1
  • Enrico bei Statistik – was ist denn das?
©2026 data-fux | Built using WordPress and Responsive Blogily theme by Superb
Cookie-Zustimmung verwalten
Um dir ein optimales Erlebnis zu bieten, verwenden wir Technologien wie Cookies, um Geräteinformationen zu speichern und/oder darauf zuzugreifen. Wenn du diesen Technologien zustimmst, können wir Daten wie das Surfverhalten oder eindeutige IDs auf dieser Website verarbeiten. Wenn du deine Zustimmung nicht erteilst oder zurückziehst, können bestimmte Merkmale und Funktionen beeinträchtigt werden.
Funktional Immer aktiv
Die technische Speicherung oder der Zugang ist unbedingt erforderlich für den rechtmäßigen Zweck, die Nutzung eines bestimmten Dienstes zu ermöglichen, der vom Teilnehmer oder Nutzer ausdrücklich gewünscht wird, oder für den alleinigen Zweck, die Übertragung einer Nachricht über ein elektronisches Kommunikationsnetz durchzuführen.
Vorlieben
Die technische Speicherung oder der Zugriff ist für den rechtmäßigen Zweck der Speicherung von Präferenzen erforderlich, die nicht vom Abonnenten oder Benutzer angefordert wurden.
Statistiken
Die technische Speicherung oder der Zugriff, der ausschließlich zu statistischen Zwecken erfolgt. Die technische Speicherung oder der Zugriff, der ausschließlich zu anonymen statistischen Zwecken verwendet wird. Ohne eine Vorladung, die freiwillige Zustimmung deines Internetdienstanbieters oder zusätzliche Aufzeichnungen von Dritten können die zu diesem Zweck gespeicherten oder abgerufenen Informationen allein in der Regel nicht dazu verwendet werden, dich zu identifizieren.
Marketing
Die technische Speicherung oder der Zugriff ist erforderlich, um Nutzerprofile zu erstellen, um Werbung zu versenden oder um den Nutzer auf einer Website oder über mehrere Websites hinweg zu ähnlichen Marketingzwecken zu verfolgen.
  • Optionen verwalten
  • Dienste verwalten
  • Verwalten von {vendor_count}-Lieferanten
  • Lese mehr über diese Zwecke
Einstellungen ansehen
  • {title}
  • {title}
  • {title}