Duplikate löschen mit verschiedenen Inhalten
#1
Hallo zusammen,

ich habe eine Excel Liste, die Stammdaten. Diese möchte ich abgleichen und Duplikate entfernen.
Der Inhalt der Zeilen ist aber nicht gleich, ausser in Spalte D
Wie kann die Duplikate, die die gleiche Nummer in Spalte D haben, also die ganze Zeile löschen?
Bisher kann ich das nur manuell, sind aber ein paar tausend Zeilen.

Bitte um Hilfe
Antworten Top
#2
Geht mit "Dupliakte entfernen" (zumindest in meiner Excel Version), Hilfsspalte und ZÄHLENWENN, Powerquery, VBA Makro
Antworten Top
#3
Hi,

markiere die gesamten Daten und entferne bei "Duplikate entfernen" alle Haken, bis auf den bei "D".

VG Regina
Antworten Top
#4
Die Hinzugefügten Doppelten Einträge werden so gelöscht, aber nicht die schon vorhandenen aus den Stammdaten.
Gleiche Ergebnis im Power Query.
Antworten Top
#5
(30.11.2025, 17:36)Carfesch schrieb: Die Hinzugefügten Doppelten Einträge werden so gelöscht, aber nicht die schon vorhandenen aus den Stammdaten.
Gleiche Ergebnis im Power Query.
??? 

Beispieldatei mit Wunschergebnis!
Antworten Top
#6
Es handelt sich ja nicht um Duplikate, sondern um die Wiederholung von einem oder mehreren (BIS ZU allen, aber nicht notwendigerweise) Feldern.

Da einige Felder der "unvollkommenen Duplikate" ungleich sind, MUSS ES EGAL SEIN, welcher der Datensätze gelöscht wird. Auf jeden Fall verliert man INFORMATION.

Also, mit dynamischen Funktionen:

  1. Zeilen numerieren (neue Spalte X)
  2. Nach Duplikatfeldern (ggflls mehrere Sortierfelder) sortieren
  3. Zeilen numerieren (neue Spalte Y).
  4. Spalte Z anhängen mit (Formel=) WAHR oder FALSCH für (ggflls partielle) Gleichheit mit dem Vorgängersatz
  5. Nach FALSCH filtern
  6. Ausgangssort X herstellen
  7. X, Y und Z nicht mehr mit ausgeben

Erweitern könnte man nun noch nach Punkt 5. mit einer Spalte AA, die die Differenz Spalte Y mit ihrem Vorgänger Y bildet. Dann sieht man nachträglich, wieviele partielle Duplikate man überhaupt hatte (nachdem sie längst gelöscht sind).
Antworten Top
#7
Ich bin so ein bisschen aus der Übung. 

Beispiel: Namen, Vornamen, Geburtsdatum, Adressen. 
1) Nur der Satz mit der neuesten Adresse bei identischen 3 Erstspalten soll erhalten bleiben; 
2) außerdem die vorherige (Nicht)-Sortierung. 
3) Und es soll angezeigt werden, wieviele Sätze mit den Erstspalten es vor dem Filtern gab.

1) und 3) geht mit der eingebauten Excel-Funktion "Duplikate löschen" nicht.


.xlsx   Mappe1.xlsx (Größe: 11,19 KB / Downloads: 2)
Antworten Top
#8
(30.11.2025, 17:36)Carfesch schrieb: Die Hinzugefügten Doppelten Einträge werden so gelöscht, aber nicht die schon vorhandenen aus den Stammdaten.
Gleiche Ergebnis im Power Query.

Dann hast Du unsichtbare Zeichen in den Daten, meistens ist es ein Leerzeichen oder die Schreibweise ist nicht exakt identisch.
Wenn die Daten irgendwo exportiert wurden, dann kommt auch schon mal ein ASCII 160 vor, auch das seht wie ein Leerzeichen aus.

Mach Dir eine Index Spalte hinzu (falls die Reihenfolge wichtig ist)
Sortiere die Daten AZ und dann kuck Dir die vermeintlichen Duplikate genau an.
Ediere auch die Zellen und schau welchen Inhalt sie haben.

Da es manchmal ganz geschickt gestrickte Dinge in Daten gibt: Formatiere alle Daten als Text um z.B. Zahlen ala "Mutter M"0 von wirklichen Texten unterscheiden zu können.

Andreas.
Antworten Top
#9
Hallöchen,

eine einfache Prüfung wäre z.B. anhand der:
=LÄNGE(A1)

Um z.B. Unterschiede zwischen normalem und 160er Leerzeichen kenntlich zu machen, könnte man die Zeichencodes addieren mit was wie dem:
=SUMME(CODE(TEIL(A1;ZEILE(INDIREKT("1:"&LÄNGE(A1)));1)))
.      \\\|///      Hoffe, geholfen zu haben.
       ( ô ô )      Grüße, André aus G in T  
  ooO-(_)-Ooo    (Excel 97-2019+365)
Antworten Top
#10
Hallo

ich habe auch noch einen Vorschlag aus der Praxis.  Etwas ungewöhnlich, klappt aber.
Gibt es eine Spalte mit forlaufender ID-Nr.?  Sonst zuerst eine solche Spalte neu einfügen.

Sortiere die Spalte D nach Werten, dann hast du alle doppelten untereinander stehen.
Dann lösche ich in Spalte D alle unerwünschten Zellen weg. Sortiere dann nach Spalte D.
Jetzt kannst du alle Leerzeilen löschen und nach Spalte ID-Nr die Daten wieder sortieren.

Der Vorteil ist, mit sieht alle doppleten und kann manuell entscheiden was gelöscht wird.
Wenn wir konkrete Angaben hätten was erhalten bleiben muss, was weg kann, könnte 
man dafür ein Makro schreiben.

mfg Gast 123
Antworten Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 2 Gast/Gäste