Clever-Excel-Forum

Normale Version: Textfelder vergleichen
Du siehst gerade eine vereinfachte Darstellung unserer Inhalte. Normale Ansicht mit richtiger Formatierung.
Liebe Leute,

ich bin neu im Forum, habe mich wegen dieser Frage angemeldet:

Ich habe eine Tabelle, in der es u.a. zwei Spalten mit jeweils längeren Texteinträgen pro Zeile gibt (Textfelder aus einer Befragung):

ID ___ Textfeld 1 ___ Textfeld 2 ___ V1

Mein Ziel: In einer weiteren Spalte V1 sollen
1) identische Texte aus den beiden Zellen mit einer "1" und
2) ähnliche (gibt es da eine Funktion, evtl. über VBA) Textfelder mit einer "2"markiert werden.

Da ich leider kaum VBA kann, kann ich auch nicht einschätzen, ob es für einen solchen Textvergleich irgendeine Möglichkeit gibt (glätten?).

Freue mich auf RÜckmeldungen.
Also 1) ist schon mal leicht zu beantworten:
In V1 diese Formel eintragen
Code:
=WENN(B1=C1;1;"")

Zu 2) ist viel zu wenig Information vorhanden um das pauschal zu beantworten. Wird aber sicherlich nicht einfach, wenn es überhaupt funktioniert.
Was für Information braucht es? Es handelt sich um jeweils um Textfelder (zwei Befragungen zu zwei Zeitpunkten). Ich möchte 1) herausfinden, ob beide Texte identisch sind (ob also jemand einfach copy/paste genutzt hat, scheint mit "Wenn"-Befehl zu gehen, danke) oder 2) die Texte weitgehend identisch sind. Und das ist scheinbar nicht so einfach, oder?
Ich habe schon im ersten Beitrag verstanden, was du haben möchtest, eine Wiederholung der gleichen Punkte bringt uns nicht weiter. Es braucht die Information, WELCHE Texte da verglichen werden sollen auf Ähnlichkeit. Die Lösung für die identischen Texte hast du von mir ja schon bekommen.
Aber es ist ein himmelweiter Unterschied ob ich zB diese beiden Texte vergleiche:

1. Viele Autofahrer fahren oftmals zu schnell
2. Viele Autofahrer fahren oftmals viel zu schnell

oder

1. Viele Autofahrer fahren oftmals zu schnell
2. Viele Autofahrer sind oftmals zu schnell unterwegs

oder

1. Viele Autofahrer fahren oftmals zu schnell
2. Viele Autofahrer fahren oftmals in betrunkenem Zustand

Denn bei der ersten Variante kann ich zB die ersten 32 Zeichen vergleichen und ich werde eine Übereinstimmung finden.
Bei Variante zwei habe ich die gleiche Aussage, aber einen sehr unterschiedlichen Text.
Bei der dritten Variante wiederum habe ich einen sehr ähnlichen Text, der aber etwas komplett anderes aussagt.

Excel ist ein Tabellenkalkulationsprogramm und kein Semantiktool.
Ok, das verstehe ich. Danke fpr die Ausführung.
Nein, es geht nicht um inhaltliche Aussagen im Text, sondern rein darum, inwieweit ein Text anhand der Worte/Buchstaben (weitgehend) deckungsgleich ist. Wenn der Inhalt zweier Textfelder also z.B. zu 95% identisch ist, würde ich hier bei V1 eine "vergeben". Wie gesagt, ich weiß nicht ob und wie das geht, aber ich habe mal gehört, dass man mit VBA etwas in diese Richtung machen kann.
Hallo Arno,

dann zeig uns halt ein paar Beispiele, wie so ein Text aussehen kann. Excel muss ja feste Bezüge haben, damit es die Texte vergleichen kann - und das ist nun einmal - entgegen deiner Meinung-
Zitat:es geht nicht um inhaltliche Aussagen im Text,
de Textinhalt.
Hallo,

Zitat:Nein, es geht nicht um inhaltliche Aussagen im Text, sondern rein darum, inwieweit ein Text anhand der Worte/Buchstaben (weitgehend) deckungsgleich ist

Das ist für mein Verständnis eine sehr ungewöhnliche Form, eine Befragung auszuwerten.
Da ich neugierig bin frage ich Dich, ob ein wenig mehr Informationen über Dein Vorhaben
zu erfahren ist?
Erstellen 0 oder 1:

Dann reicht schon:



PHP-Code:
=N(A1=B1
Hallo,

es geht mir nicht darum, eine Befragung inhaltlich auszuwerten. Es geht darum herauszufinden, ob an zwei Messzeitpunkten verbotenerweise identischer bzw. fast identischer Text eingegeben wurde. Identischen Text zu identifizieren ist relativ simpel, siehe oben. Aber wie finde ich heraus (20.000 Datensätze), ob jemand den Text einfach kopiert hat und vielleicht nur marginal Leerzeichen oder andere Spiegelstriche verwendet hat? Das ist das Problem und ich hatte gehofft, eine Lösung für so eine ungewöhnliche Fragestellung zu finden.
Ich habe mal etwas gesucht und bin dabei darauf gestoßen:

https://groups.google.com/forum/#!topic/...N4lpeTQwLw

Der drittletzte Beitrag von Michael Schwimmer enthält folgende Formel
Code:
=SUMME(WENN(SPALTE(1:1)>MAX(LÄNGE(A1);LÄNGE(B1));0;ABS(WENN(SPALTE(1:1)>LÄNGE(A1);0;CODE(TEIL(A1;SPALTE(1:1);1)))-WENN(SPALTE(1:1)>LÄNGE(B1);0;CODE(TEIL(B1;SPALTE(1:1);1))))))

Probier das mal aus, indem du in A1 und B1 einen identischen Text eingibtst. Wichtig ist, dass du die Formel als Matrixformel eingibst, sprich die Eingabe muss mit Strg+Umschalt+Enter beendet werden.

Bei komplett identischen Texten sollte das Ergebnis 0 sein. Je größer die Abweichung, desto größer die Zahl die herauskommt. Allerdings habe ich bei meinem Test festgestellt, dass alleine ein(!) Leerzeichen an unterschiedlich gesetzten Stellen unterschiedliche Ergebnisse ausgibt. Von daher weiß ich nicht, wie hilfreich diese Funktion am Ende für dich ist.

Ansonsten bleibt aus meiner Sicht nur Programmierung, wie aufwändig das ist, kann ich nicht beurteilen. Wird vermutlich keiner hier gratis machen.