Clever-Excel-Forum

Normale Version: Kontonummern und Namen abgleichen
Du siehst gerade eine vereinfachte Darstellung unserer Inhalte. Normale Ansicht mit richtiger Formatierung.
Guten Morgen zusammen,

und bereits jetzt vielen Dank für Eure Hilfe Smile

Ich bin nämlich mit meinem "Excel"-Latein leider am Ende.
Nach stundenlangem probieren und suchen, komme ich nun definitiv nicht weiter.

Folgendes Problem habe ich:[/u

Ich habe eine Datei mit zehn verschiedenen Tabellenblättern auf welchem sich immer eine Tabelle befindet.

In Spalte A befinden sich Kontonummern.
In Spalte C befinden sich Kundennamen.

Jede einzelne Tabelle auf dem jeweiligen Tabellenblatt steht für eine separate Niederlassung.
"Eigentlich" sollte eine Kontonummer und ein Kundenname für alle Niederlassungen gleich sein und auch nur einmal vorkommen.

Nun habe ich in der Vergangenheit oft aus Zeitmangel nicht überprüft ob es einen Kunden bereits gibt.
Und ihn zudem möglichweise auch nicht genau so namentlich angelegt wie in einer anderen Niederlassung:

[u]Beispiel:


           Niederlassung 1                                      Niederlassung 2

Spalte A             Spalte C                          Spalte A             Spalte C               

12345                Müller                             12345                 Fritz
22222                Maier                              77777                Maier
99999                Schmidt                           67899                Schmitt

Im Beispiel oben benötige ich eine Formel die
1. Meldet, dass in Niederlassung 1 Nummer 12345 einen anderen Kunden hat als in Niederlassung 2
2. Meldet, dass in Niederlassung 1 Kunde Maier eine andere Kundennummer hat als in Niederlassung 2.
3. Meldet, dass in Niederlassung 1 bereits einen Kunden namens Schmitt gibt der ähnlich heißt und es sich hier in Niederlassung 2 um einen Schreibfehler handeln könnte.

Das ganze über zehn Niederlassungen Big Grin

Ich habe sämtliche Vergleichs-, wenn/und, Summenprodukt-Formel, Dubletten und bedingte Formatierungen probiert.
Leider ohne Erfolg.

Ich hoffe, dass mir einer von Ihnen/Euch (wir können gerne beim Du bleiben) helfen kann.

Vielen Dank im Voraus und ich bin echt gespannt.

Viele Grüße Timo
Moin

Kopiere alle Listen untereinander mit der zusätzlichen Spalte "Niederlassung".
Entferne alle Duplikate aus den Spalten "Kontonummer" und "Kundenname".
Sortiere die Liste nach "Kontonummer" und "Kundenname".
Jetzt kannst du die Einträge überprüfen.
@ShiftDel: Abgeshen davon, dass man wie Du im Grunde sagst die Daten in einem Sheet unterbringen sollte, dürfte Dein Vorgehen nicht erfüllen, was der TS möchte.

Der TS möchte ja drei Dinge
Zitat:1. Meldet, dass in Niederlassung 1 Nummer 12345 einen anderen Kunden hat als in Niederlassung 2
2. Meldet, dass in Niederlassung 1 Kunde Maier eine andere Kundennummer hat als in Niederlassung 2.
3. Meldet, dass in Niederlassung 1 bereits einen Kunden namens Schmitt gibt der ähnlich heißt und es sich hier in Niederlassung 2 um einen Schreibfehler handeln könnte.
1. und 2. kriegt man mit Power Query relativ einfach hin (2. habe ich gerade gemacht, 1. ist ähnlich)
3. wahrscheinlich auch, aber da müsste man IMHO etwas Aufwand treiben (könnte evtl. mit Fuzzy-Abgleich und einer Transformationstabelle gehen)

Und solange der TS keine Beispieldatei/-daten mit mehr als nur je 3 Datensätzen liefert ...
Hallo ihr beiden und vielen Dank für Eure Rückmeldungen.

Ja, das ich alles auf ein Blatt kopieren muss, dachte ich mir schon.
Jetzt habe ich Gewissheit.

@shift-del: Das mit dem Dubletten habe ich schon versucht. Leider gibt er mir dann die aus die gleich sind.
Ich möchte ja aber die, die "annähernd" gleich sind.

@warkings: Mit Power Query und Fuzzy kenne ich mich leider gar nicht aus. Finde diese Felder auch in Excel nicht.
Ist das eine "PRO-Version"?

Ich habe befürchtet, dass das alles leider nicht so einfach wird.
Bin aber bereits über jede Hilfe sehr dankbar.

Ich habe anbei eine Datei gehängt. Darin sind drei Niederlassungen enthalten mit Kontonummer und Kundennamen.
Die Farblich markierten Felder weisen die Unstimmigkeiten auf.

Vielen Dank nochmals.

Gruß Timo
Arbeitsblatt mit dem Namen 'Tabelle1'
ABCDEFGHIJKLMNOPQ
1Schritt 1: Alles in einer ListeSchritt 2: Duplikate entfernen (KontoNr + KundenName)Schritt 3a: Sortieren KontoNr + KundenNameSchritt 3a: Sortieren KundenName + KontoNrSchritt 4: Daten in den Original-Listen bereinigen
2
3KontoNrKundenNameNiederlassungKontoNrKundenNameNiederlassungKontoNrKundenNameNiederlassungKontoNrKundenNameNiederlassung
412345MüllerNL112345MüllerNL112345FritzNL220024EngelNL1
522222MaierNL122222MaierNL112345MüllerNL120031FischerNL1
699999SchmidtNL199999SchmidtNL120023SchmidtNL212345FritzNL2
720024EngelNL120024EngelNL120024EngelNL120027FritzNL1
820025HermannNL120025HermannNL120025HermannNL144444FritzNL3
920026SaboNL120026SaboNL120026SaboNL120029GerberNL1
1020027FritzNL120027FritzNL120027FritzNL120025HermannNL1
1120029GerberNL120029GerberNL120029GerberNL120030KammNL1
1220030KammNL120030KammNL120030KammNL120035KolbNL1
1320031FischerNL120031FischerNL120031FischerNL122222MaierNL1
1420035KolbNL120035KolbNL120035KolbNL177777MaierNL2
1520036RichardNL120036RichardNL120036RichardNL120047MartinNL1
1620047MartinNL120047MartinNL120047MartinNL112345MüllerNL1
1720051WeberNL120051WeberNL120051WeberNL120062NeumannNL1
1820052SchreinerNL120052SchreinerNL120052SchreinerNL120036RichardNL1
1920053SchneiderNL120053SchneiderNL120053SchneiderNL120026SaboNL1
2020054VogelNL120054VogelNL120054VogelNL120023SchmidtNL2
2120062NeumannNL120062NeumannNL120062NeumannNL199999SchmidtNL1
2277777MaierNL277777MaierNL222222MaierNL199999SchmittNL3
2320023SchmidtNL220023SchmidtNL244444FritzNL320053SchneiderNL1
2420024EngelNL212345FritzNL277777MaierNL220052SchreinerNL1
2520025HermannNL299999SchmittNL399999SchmidtNL120054VogelNL1
2620026SaboNL244444FritzNL399999SchmittNL320051WeberNL1
2712345FritzNL2
2820029GerberNL2
2920030KammNL2
3020031FischerNL2
3120035KolbNL2
3220036RichardNL2
3320047MartinNL2
3420051WeberNL2
3520052SchreinerNL2
3620053SchneiderNL2
3720054VogelNL2
3820062NeumannNL2
3922222MaierNL3
4099999SchmittNL3
4120024EngelNL3
4220025HermannNL3
4320026SaboNL3
4444444FritzNL3
4520029GerberNL3
4620030KammNL3
4720031FischerNL3
4820035KolbNL3
4920036RichardNL3
5020047MartinNL3
5120051WeberNL3
5220052SchreinerNL3
5320053SchneiderNL3
5420054VogelNL3
5520062NeumannNL3
Verwendete Systemkomponenten: [Windows (32-bit) NT 10.00] MS Excel 2016
Diese Tabelle wurde mit Tab2Html (v2.6.2) erstellt. ©Gerd alias Bamberg
Hallo,

so stellt sich das dar, wenn alle Daten auf ein Blatt kopiert werden. Die Funktion Duplikate entfernen wurde nach den Spalten Nummer und Name durchgeführt.

Niederlassung1

ABCD
1NummerVornameNameFiliale
220024EngelFiliale 1
320031FischerFiliale 1
420027FritzFiliale 1
512345FritzFiliale 2
644444FritzFiliale 3
720029GerberFiliale 1
820025HermannFiliale 1
920030KammFiliale 1
1020035KolbFiliale 1
1122222Maier Filiale 1
1277777Maier Filiale 2
1320047MartinFiliale 1
1412345MüllerFiliale 1
1520062NeumannFiliale 1
1620036RichardFiliale 1
1720026SaboFiliale 1
1899999SchmidtFiliale 1
1920023SchmidtFiliale 2
2099999SchmittFiliale 3
2120053SchneiderFiliale 1
2220052SchreinerFiliale 1
2320054VogelFiliale 1
2420051WeberFiliale 1

Excel Tabellen im Web darstellen >> Excel Jeanie HTML 4.8
@Timo288: Power Query kommt seit 2013 mit Excel

Mit PQ könnte ein Ergbnis für1. Meldet, dass in Niederlassung 1 Nummer 12345 einen anderen Kunden hat als in Niederlassung 2 wie folgt aussehen
[attachment=35278]
und für 2. Meldet, dass in Niederlassung 1 Kunde Maier eine andere Kundennummer hat als in Niederlassung 2.
[attachment=35278]

3. Meldet, dass in Niederlassung 1 bereits einen Kunden namens Schmitt gibt der ähnlich heißt und es sich hier in Niederlassung 2 um einen Schreibfehler handeln könnte.
wäre evtl. indirekt mit 1. erledigt
Hallo Timo,

mit den hier gezeigten Daten kannst du zuverlässig nur feststellen, ob eine Kundennummer mehrfach verwendet wird. da es viele Namen mit unterschiedlichen Schreibweisen gibt, ist bspw. Schmitt und Schmidt noch kein Hinweis auf "doppelt" angelegt. Da musst du schon die Adresse hinzuziehen, um zu überprüfende Kunden zu markieren, die dann noch manuell überprüft werden müssen. Denn wenn auch selten, kann es doch vorhommen dass es einen Micheal Schmitt sowie einen Michael Schmidt gibt, die Beidne in Frankfurt in der Mainzer Landstr. 188 wohnen. Denn es könnte sich ja um ein Hochhaus mit zig Bewohnern handeln.

Wobei eine Fuzzysuche die eine Sache ist, die sich nocht relativ einfach realisieren lässt. Die Programmierung einer Dublettenprüfung ist da schon wesentlich aufwändiger. Denn Schmidt und Schmitt untersxcheiden sichg erst am Ende. Aber Clarissa und Larissa unterscheiden sich schon auf der Ersten Stelle, kann aber auch eine Dublette sein.

Und Power Query unterstützt zwar den Fuzzy-Join. Aber haklbwegs vernünftige Ergebnisse bringt dieser nur, wenn nicht gleichzeitig mehrere (Name, Vorname, Straße, Ort) Adressfelder für den Fuzzy-Join verwendet werden.

Mit etwas Phantasie lässt sich aber dennoch mit Power Query eine recht ordentliche Fuzzy-Suche realisieren. Ist aber dann immer noch keine Liste, die dir mögliche Dubletten zeigt.

Hierzu eignet sich bspw. die Vorgehensweise, in eine separate Spalte PLZ, die Ersten sowie die letzten n (bspw. 5) Stellen der Straße zu übernehmen und die Liste anschliessend danach zu sortieren. Danach kannst du filtern und prüfen.
Vielen Dank euch allen für eure Vorschläge.
Das freut mich sehr.

@warkings: Deinen Vorschlag finde ich super. Es sieht so aus, also ob dies genau meine Vorstellung sei.
Leider haben wir im Geschäft aber wirklich kein Power Query (scheint noch 2010 zu sein)

Daher werde ich mich wohl doch mit der vorgeschlagenen Dubletten-Funktion von shift-del und Klaus-Dieter
weiter ans Werk machen. Das sieht ganz gut aus, auch wenn ich am Ende natürlich noch manuell abgleichen muss.

War nicht ganz mein Ziel aber da könnt ihr ja nichts für.

Vielen Dank trotzdem Smile