10.06.2016, 10:28
Einen guten Tag wünsche ich euch Allen!
Ich habe bisher fleißig mitgelesen und wollte jetzt auch mal gezielt fragen stellen, erstmal zu mir: Ich bin 29 Jahre, habe nach meinem naturwissenschaftlichen Studium eine Weiterbildung ins Datenmanagement gemacht und bin jetzt in der Traineezeit, dementsprechend auch voller Sorge, dass ich übernommen werde!
Derzeit erstelle ich ein Quality Control Programm auf Excel/VBA Basis, welches Daten aus einer xml (Ursprung ist ein online Dokumentenablagesystem) verarbeitet. Die Datei hat ca 20 Spalten und ist 40.000 Zeilen lang. Ich muss sagen, meine Kenntnisse sind eher rudimentär und wir haben nur eine Woche VBA gehabt, ich hab jetzt mit meinem Wissenstand schon einige Abfragemöglichkeiten (Über eine UserForm für den User) eingebaut.
Mich lassen jetzt aber 2 Aspekte ein wenig verzweifeln:
Ich soll alle Duplikate (Innerhalb einer Spalte) und ihren Pfad (Spalte die danebensteht und verkettet wird bei der Ausgabe) ausgeben.
Also sagen wir mal
pfad1 | Test1
pfad2 | Test2
pfad3 | Test3
pfad4 | Test2
pfad4 | Test1
pfad6 | Test1
Pfad7 | Test4
Ich habe das ganze bisher so gelöst, dass ich über eine Hilfsspalte V2 (nach unten bis 40.000 gezogen) " =ZÄHLENWENN($U2:U$2;U2) " die Anzahl wenn gefunden ausgebe.
Das ganze wird dann mit:" =WENN(V2>1;Tabelle1!P2&U8&"("&V2&")";) " verkettet und dann im nächsten Schritt über ein Makro in der nächsten Zeile sortiert.
Was mir nun fehlt! ist natürlich der Erste Wert des Duplikates, der unbedingt auch angegeben sein muss (damit man dann hinterher die Pfade vergleichen kann).
Ich habe einige Ideen dazu, aber die beruhen fast alle auf noch weiteren Hilfsspalten und die Datei hat mittlerweile die 10mb Grenze geknackt und wird schon immer langsamer (und stürzt häufiger ab?!). Aber wenn da jemand eine gute Idee mit Hilfsspalten hat, würde ich mich auch sehr freuen.
Ansonsten wäre es doch bestimmt möglich, über ein VBA Makro und Schleifen das ganze Auswerten zu lassen: Quasi -> WENN(Duplikatanzahl von Wert = 2 ( Dann -> Liste durchsuchen bis Wert UND Duplikatanzahl=1 gefunden;Wert+Pfad ausgeben;)Sonst Nichts);
Hat da jemand eine Idee?
Das größte Problem ist, ich bin der einzige ITler hier und habe auch niemanden um Sachen nachzufragen, kein Buch etc. und bring mir quasi alles beim arbeiten am Projekt und aus google selbst bei und habe Angst, dabei wichtige und viel einfachere Wege zu übersehen.
Ich hätte an sich noch 1000 Fragen, aber ich würde mich wahnsinnig über eine Antwort zu diesem Thema freuen!
Viele dank!
Ich habe bisher fleißig mitgelesen und wollte jetzt auch mal gezielt fragen stellen, erstmal zu mir: Ich bin 29 Jahre, habe nach meinem naturwissenschaftlichen Studium eine Weiterbildung ins Datenmanagement gemacht und bin jetzt in der Traineezeit, dementsprechend auch voller Sorge, dass ich übernommen werde!
Derzeit erstelle ich ein Quality Control Programm auf Excel/VBA Basis, welches Daten aus einer xml (Ursprung ist ein online Dokumentenablagesystem) verarbeitet. Die Datei hat ca 20 Spalten und ist 40.000 Zeilen lang. Ich muss sagen, meine Kenntnisse sind eher rudimentär und wir haben nur eine Woche VBA gehabt, ich hab jetzt mit meinem Wissenstand schon einige Abfragemöglichkeiten (Über eine UserForm für den User) eingebaut.
Mich lassen jetzt aber 2 Aspekte ein wenig verzweifeln:
Ich soll alle Duplikate (Innerhalb einer Spalte) und ihren Pfad (Spalte die danebensteht und verkettet wird bei der Ausgabe) ausgeben.
Also sagen wir mal
pfad1 | Test1
pfad2 | Test2
pfad3 | Test3
pfad4 | Test2
pfad4 | Test1
pfad6 | Test1
Pfad7 | Test4
Ich habe das ganze bisher so gelöst, dass ich über eine Hilfsspalte V2 (nach unten bis 40.000 gezogen) " =ZÄHLENWENN($U2:U$2;U2) " die Anzahl wenn gefunden ausgebe.
Das ganze wird dann mit:" =WENN(V2>1;Tabelle1!P2&U8&"("&V2&")";) " verkettet und dann im nächsten Schritt über ein Makro in der nächsten Zeile sortiert.
Was mir nun fehlt! ist natürlich der Erste Wert des Duplikates, der unbedingt auch angegeben sein muss (damit man dann hinterher die Pfade vergleichen kann).
Ich habe einige Ideen dazu, aber die beruhen fast alle auf noch weiteren Hilfsspalten und die Datei hat mittlerweile die 10mb Grenze geknackt und wird schon immer langsamer (und stürzt häufiger ab?!). Aber wenn da jemand eine gute Idee mit Hilfsspalten hat, würde ich mich auch sehr freuen.
Ansonsten wäre es doch bestimmt möglich, über ein VBA Makro und Schleifen das ganze Auswerten zu lassen: Quasi -> WENN(Duplikatanzahl von Wert = 2 ( Dann -> Liste durchsuchen bis Wert UND Duplikatanzahl=1 gefunden;Wert+Pfad ausgeben;)Sonst Nichts);
Hat da jemand eine Idee?
Das größte Problem ist, ich bin der einzige ITler hier und habe auch niemanden um Sachen nachzufragen, kein Buch etc. und bring mir quasi alles beim arbeiten am Projekt und aus google selbst bei und habe Angst, dabei wichtige und viel einfachere Wege zu übersehen.
Ich hätte an sich noch 1000 Fragen, aber ich würde mich wahnsinnig über eine Antwort zu diesem Thema freuen!
Viele dank!