Duplikate nach alter entfernen Power-Query
#1
Hallo Zusammen,

Ich hab da mal eine frage, und hab tatsächlich genau meine Fragestellung icht finden können.

Ich möchte in der Angehängten datei die Duplikate entfernen die am Jüngsten sind, und das älteste beibehalten.

wie bekomme ich das mit Powerquery hin? Es sollen alle spalten bestehen bleiben ausser die Spalte Erstellt am.

Danke für eure Mühe!


Angehängte Dateien
.xlsx   test123.xlsx (Größe: 252,54 KB / Downloads: 5)
Antworten Top
#2
Hallo StaBau11,

ich habe in PQ die Daten gruppiert nach Name & Vorname. Für Andresen Sönke erhält man:
02.04.2024 Oberdorf 13b
27.03.2024 Oberdorf 13
26.03.2024 Oberdorf 11

Welche der 3 Zeilen sollen denn da weg?

fragt sich Luschi
aus klein-Paris
Antworten Top
#3
Es ist ja so, jeder Kunde kann ja mehrere Häuser haben. Es geht darum wenn die adresse gleich ist, der name und vorname gleich ist, dann soll er dieduplikate vergleichen und die Älteste datei aus der Quelle behalten. alle anderen duplikate sollen weg. Vllt brauchst du noch die Quelldatein oder?
Antworten Top
#4
(09.01.2025, 09:55)StaBau11 schrieb: 1.) Ich möchte in der Angehängten datei die Duplikate entfernen die am Jüngsten sind, und das älteste beibehalten.

2.) Es sollen alle spalten bestehen bleiben ausser die Spalte Erstellt am.

Hi,

zu 1.) Was soll das genau heißen? Die jüngsten Duplikate entfernen oder nur die ältesten behalten? 
Wenn nur die ältesten behalten werden sollen, dann gruppiere (zusätzlich zu Luschis Vorschlag auch noch nach Ort, Straße und Hausnr.) ,und filtere nach dem Min-Wert im Datum, wenn nur die Duplikate entfernt werden sollen, nach der Gruppierung alle Spalten markieren und Duplikate entfernen lassen. 
Ich vermute aber, es sollen eigentlich die jüngsten (also neuesten) behalten werden... dann nach dem Max-Wert filtern

zu 2.) Das ist jetzt nicht ernst gemeint, oder?
Der sicherste Ansatz für einen Irrtum ist der Glaube, alles im Griff zu haben.
Nur, weil ich den Recorder bedienen kann, macht mich das noch lange nicht zum Musiker.

Ciao, Ralf

Antworten Top
#5
@ Ralf

Ich bekomme Daten von einem Externen Auftraggeber, dieser pflegt seine daten schlecht und deshalb habe ich mich dazu entschlossen, ich möchte die erste variante einer zeile (Duplikat) behalten.
Wenn die zu blöd sind ihre daten ordentlich zu pflegen, ist das nciht mein bier 91

Demzufolge die älteste datei.
Antworten Top
#6
(09.01.2025, 12:39)StaBau11 schrieb: @ Ralf

Ich bekomme Daten von einem Externen Auftraggeber, dieser pflegt seine daten schlecht und deshalb habe ich mich dazu entschlossen, ich möchte die erste variante einer zeile (Duplikat) behalten.
Wenn die zu blöd sind ihre daten ordentlich zu pflegen, ist das nciht mein bier 91

Demzufolge die älteste datei.

...es ist leider doch Dein Bier. Andernfalls bräuchtest Du Dich ja nicht damit befassen... und wir erst recht nicht...

Hab nicht alles kontrolliert.... das ist Dein Job, aber... die Datenhaltung scheint echt Sch... zu sein...
Bsp.:     

Sind das Tippfehler? Wohnt der Andreas Abild tatsächlich in 3 Häusern? Oder gehören ihm die nur? Wenn ja, dann müssen alle beibehalten werden, wenn nicht, welche sollen weg? Die Jüngsten oder die falschen? Oder gar keine? Sind ja 3 unterschiedliche Datensätze...
Oder bei Ackermann.  Pumpstraße 8 - und  Pumpstraße. 
2 Adressen? Tippfehler?
Der sicherste Ansatz für einen Irrtum ist der Glaube, alles im Griff zu haben.
Nur, weil ich den Recorder bedienen kann, macht mich das noch lange nicht zum Musiker.

Ciao, Ralf

Antworten Top
#7
Hier ein doppelter, den du mit deiner angedachten Vorgehensweise nicht findest. auch den doppelten in der "Wanderuper Straße 26" findest du so nicht! Und bei Jan Langholz muss man wissen, ob es sich bei "Raiffeisenstraße 10" und   "Raiffeisenstraße 10a" um ein oder zwei Objekte handelt.


Angehängte Dateien Thumbnail(s)
   
Antworten Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste