Guten Morgen zusammen,
und bereits jetzt vielen Dank für Eure Hilfe
Ich bin nämlich mit meinem "Excel"-Latein leider am Ende.
Nach stundenlangem probieren und suchen, komme ich nun definitiv nicht weiter.
Folgendes Problem habe ich:[/u
Ich habe eine Datei mit zehn verschiedenen Tabellenblättern auf welchem sich immer eine Tabelle befindet.
In Spalte A befinden sich Kontonummern.
In Spalte C befinden sich Kundennamen.
Jede einzelne Tabelle auf dem jeweiligen Tabellenblatt steht für eine separate Niederlassung.
"Eigentlich" sollte eine Kontonummer und ein Kundenname für alle Niederlassungen gleich sein und auch nur einmal vorkommen.
Nun habe ich in der Vergangenheit oft aus Zeitmangel nicht überprüft ob es einen Kunden bereits gibt.
Und ihn zudem möglichweise auch nicht genau so namentlich angelegt wie in einer anderen Niederlassung:
[u]Beispiel:
Niederlassung 1 Niederlassung 2
Spalte A Spalte C Spalte A Spalte C
12345 Müller 12345 Fritz
22222 Maier 77777 Maier
99999 Schmidt 67899 Schmitt
Im Beispiel oben benötige ich eine Formel die
1. Meldet, dass in Niederlassung 1 Nummer 12345 einen anderen Kunden hat als in Niederlassung 2
2. Meldet, dass in Niederlassung 1 Kunde Maier eine andere Kundennummer hat als in Niederlassung 2.
3. Meldet, dass in Niederlassung 1 bereits einen Kunden namens Schmitt gibt der ähnlich heißt und es sich hier in Niederlassung 2 um einen Schreibfehler handeln könnte.
Das ganze über zehn Niederlassungen
Ich habe sämtliche Vergleichs-, wenn/und, Summenprodukt-Formel, Dubletten und bedingte Formatierungen probiert.
Leider ohne Erfolg.
Ich hoffe, dass mir einer von Ihnen/Euch (wir können gerne beim Du bleiben) helfen kann.
Vielen Dank im Voraus und ich bin echt gespannt.
Viele Grüße Timo
Moin
Kopiere alle Listen untereinander mit der zusätzlichen Spalte "Niederlassung".
Entferne alle Duplikate aus den Spalten "Kontonummer" und "Kundenname".
Sortiere die Liste nach "Kontonummer" und "Kundenname".
Jetzt kannst du die Einträge überprüfen.
@ShiftDel: Abgeshen davon, dass man wie Du im Grunde sagst die Daten in einem Sheet unterbringen sollte, dürfte Dein Vorgehen nicht erfüllen, was der TS möchte.
Der TS möchte ja drei Dinge
Zitat:1. Meldet, dass in Niederlassung 1 Nummer 12345 einen anderen Kunden hat als in Niederlassung 2
2. Meldet, dass in Niederlassung 1 Kunde Maier eine andere Kundennummer hat als in Niederlassung 2.
3. Meldet, dass in Niederlassung 1 bereits einen Kunden namens Schmitt gibt der ähnlich heißt und es sich hier in Niederlassung 2 um einen Schreibfehler handeln könnte.
1. und 2. kriegt man mit Power Query relativ einfach hin (2. habe ich gerade gemacht, 1. ist ähnlich)
3. wahrscheinlich auch, aber da müsste man IMHO etwas Aufwand treiben (könnte evtl. mit Fuzzy-Abgleich und einer Transformationstabelle gehen)
Und solange der TS keine Beispieldatei/-daten mit mehr als nur je 3 Datensätzen liefert ...
Hallo ihr beiden und vielen Dank für Eure Rückmeldungen.
Ja, das ich alles auf ein Blatt kopieren muss, dachte ich mir schon.
Jetzt habe ich Gewissheit.
@shift-del: Das mit dem Dubletten habe ich schon versucht. Leider gibt er mir dann die aus die gleich sind.
Ich möchte ja aber die, die "annähernd" gleich sind.
@warkings: Mit Power Query und Fuzzy kenne ich mich leider gar nicht aus. Finde diese Felder auch in Excel nicht.
Ist das eine "PRO-Version"?
Ich habe befürchtet, dass das alles leider nicht so einfach wird.
Bin aber bereits über jede Hilfe sehr dankbar.
Ich habe anbei eine Datei gehängt. Darin sind drei Niederlassungen enthalten mit Kontonummer und Kundennamen.
Die Farblich markierten Felder weisen die Unstimmigkeiten auf.
Vielen Dank nochmals.
Gruß Timo
Hallo,
so stellt sich das dar, wenn alle Daten auf ein Blatt kopiert werden. Die Funktion Duplikate entfernen wurde nach den Spalten Nummer und Name durchgeführt.
Niederlassung1 | A | B | C | D |
1 | Nummer | Vorname | Name | Filiale |
2 | 20024 | | Engel | Filiale 1 |
3 | 20031 | | Fischer | Filiale 1 |
4 | 20027 | | Fritz | Filiale 1 |
5 | 12345 | | Fritz | Filiale 2 |
6 | 44444 | | Fritz | Filiale 3 |
7 | 20029 | | Gerber | Filiale 1 |
8 | 20025 | | Hermann | Filiale 1 |
9 | 20030 | | Kamm | Filiale 1 |
10 | 20035 | | Kolb | Filiale 1 |
11 | 22222 | | Maier | Filiale 1 |
12 | 77777 | | Maier | Filiale 2 |
13 | 20047 | | Martin | Filiale 1 |
14 | 12345 | | Müller | Filiale 1 |
15 | 20062 | | Neumann | Filiale 1 |
16 | 20036 | | Richard | Filiale 1 |
17 | 20026 | | Sabo | Filiale 1 |
18 | 99999 | | Schmidt | Filiale 1 |
19 | 20023 | | Schmidt | Filiale 2 |
20 | 99999 | | Schmitt | Filiale 3 |
21 | 20053 | | Schneider | Filiale 1 |
22 | 20052 | | Schreiner | Filiale 1 |
23 | 20054 | | Vogel | Filiale 1 |
24 | 20051 | | Weber | Filiale 1 |
Excel Tabellen im Web darstellen >> Excel Jeanie HTML 4.8
@Timo288:
Power Query kommt seit 2013 mit Excel
Mit PQ könnte ein Ergbnis für
1. Meldet, dass in Niederlassung 1 Nummer 12345 einen anderen Kunden hat als in Niederlassung 2 wie folgt aussehen
[
attachment=35278]
und für
2. Meldet, dass in Niederlassung 1 Kunde Maier eine andere Kundennummer hat als in Niederlassung 2.
[attachment=35278]
3. Meldet, dass in Niederlassung 1 bereits einen Kunden namens Schmitt gibt der ähnlich heißt und es sich hier in Niederlassung 2 um einen Schreibfehler handeln könnte.
wäre evtl. indirekt mit 1. erledigt
Hallo Timo,
mit den hier gezeigten Daten kannst du zuverlässig nur feststellen, ob eine Kundennummer mehrfach verwendet wird. da es viele Namen mit unterschiedlichen Schreibweisen gibt, ist bspw. Schmitt und Schmidt noch kein Hinweis auf "doppelt" angelegt. Da musst du schon die Adresse hinzuziehen, um zu überprüfende Kunden zu markieren, die dann noch manuell überprüft werden müssen. Denn wenn auch selten, kann es doch vorhommen dass es einen Micheal Schmitt sowie einen Michael Schmidt gibt, die Beidne in Frankfurt in der Mainzer Landstr. 188 wohnen. Denn es könnte sich ja um ein Hochhaus mit zig Bewohnern handeln.
Wobei eine Fuzzysuche die eine Sache ist, die sich nocht relativ einfach realisieren lässt. Die Programmierung einer Dublettenprüfung ist da schon wesentlich aufwändiger. Denn Schmidt und Schmitt untersxcheiden sichg erst am Ende. Aber Clarissa und Larissa unterscheiden sich schon auf der Ersten Stelle, kann aber auch eine Dublette sein.
Und Power Query unterstützt zwar den Fuzzy-Join. Aber haklbwegs vernünftige Ergebnisse bringt dieser nur, wenn nicht gleichzeitig mehrere (Name, Vorname, Straße, Ort) Adressfelder für den Fuzzy-Join verwendet werden.
Mit etwas Phantasie lässt sich aber dennoch mit Power Query eine recht ordentliche Fuzzy-Suche realisieren. Ist aber dann immer noch keine Liste, die dir mögliche Dubletten zeigt.
Hierzu eignet sich bspw. die Vorgehensweise, in eine separate Spalte PLZ, die Ersten sowie die letzten n (bspw. 5) Stellen der Straße zu übernehmen und die Liste anschliessend danach zu sortieren. Danach kannst du filtern und prüfen.
Vielen Dank euch allen für eure Vorschläge.
Das freut mich sehr.
@warkings: Deinen Vorschlag finde ich super. Es sieht so aus, also ob dies genau meine Vorstellung sei.
Leider haben wir im Geschäft aber wirklich kein Power Query (scheint noch 2010 zu sein)
Daher werde ich mich wohl doch mit der vorgeschlagenen Dubletten-Funktion von shift-del und Klaus-Dieter
weiter ans Werk machen. Das sieht ganz gut aus, auch wenn ich am Ende natürlich noch manuell abgleichen muss.
War nicht ganz mein Ziel aber da könnt ihr ja nichts für.
Vielen Dank trotzdem