Data Cleansing, auch Datenbereinigung genannt, ist der Prozess der Identifizierung und Korrektur (oder Entfernung) von fehlerhaften, ungenauen, unvollständigen oder irrelevanten Daten aus einem Datensatz. Ziel ist es, die Datenqualität zu verbessern und sicherzustellen, dass die Daten für Analysen und Entscheidungsfindungen zuverlässig und konsistent sind. Dies kann Schritte wie das Entfernen von Duplikaten, das Korrigieren von Tippfehlern, das Auffüllen fehlender Werte und das Standardisieren von Datenformaten umfassen.