ich habe ein großes PDF-Dokument in dem 40 Tabellen mit unterschiedlicher Spaltenzahl verteilt sind. Ich möchte diese Tabellen in ein XL-Blatt bekommen. Die Daten sollen nicht verarbeitet, umgeformt, vereinigt oder sonstwie verändert werden - ich möchte einfach nur die Tabellen aus dem PDF in Excel (365) haben.
Ich habe nun als Datenquelle das PDF angegeben und bin so erstmalig mit Power Query in Berührung gekommen. Wenn ich den "Seitenbereich" (?) "Abfragen und Verbindungen" öffne, bekomme ich beim Klick auf eine Tabelle eine hübsche Voransicht eingeblendet. Unten steht unter "Datenquellen" dauerhaft die typische Animation mit dem Text "wird geladen". Ein Klick unten links in der Voransicht auf "In Arbeitsblatt anzeigen" bewirkt gar nichts.
Nun hab einen Weg gefunden: Über Rechtsklick und "Laden in" bekomme ich die Daten wie gewünscht ins Arbeitsblatt. 1. Geht das einfacher als 40 mal per Rechtsklick jede einzelne Tabelle reinzuladen, irgendwie "auf einen Rutsch?" 2. Gibt es da noch etwas zu beachten wie "Dem Datenmodell diese Daten hinzufügen" checken oder eben nicht? 3. Ich habe etwas Angst, dass mir alle mühsam eingefügten Tabellen plötzlich wie "futsch" sind, weil ich irgendwas falsch mache. Kann ich die als statische Tabellen einfach "sichern". Also z.B. die Verbindung zu den Rohdaten kappen damit nix schief geht?
Sorry, klingt vielleicht etwas dumm... aber ist halt mein erster PQ-Kontakt
03.09.2025, 19:59 (Dieser Beitrag wurde zuletzt bearbeitet: 03.09.2025, 19:59 von Ralf A.)
(03.09.2025, 17:59)franky29 schrieb: ich habe ein großes PDF-Dokument in dem 40 Tabellen mit unterschiedlicher Spaltenzahl verteilt sind. Ich möchte diese Tabellen in ein XL-Blatt bekommen. Die Daten sollen nicht verarbeitet, umgeformt, vereinigt oder sonstwie verändert werden - ich möchte einfach nur die Tabellen aus dem PDF in Excel (365) haben. ... 1. Geht das einfacher als 40 mal per Rechtsklick jede einzelne Tabelle reinzuladen, irgendwie "auf einen Rutsch?" 2. Gibt es da noch etwas zu beachten wie "Dem Datenmodell diese Daten hinzufügen" checken oder eben nicht? 3. Ich habe etwas Angst, dass mir alle mühsam eingefügten Tabellen plötzlich wie "futsch" sind, weil ich irgendwas falsch mache. Kann ich die als statische Tabellen einfach "sichern". Also z.B. die Verbindung zu den Rohdaten kappen damit nix schief geht?
Moin,
selbst PQ ist keine eierlegende Wollmilchsau. Auch hier gibt es Regeln. Deshalb wird das, was Du Dir wünschst, nicht à la Simsalabim funktionieren. Vorallem dann nicht, wenn die Dokumente nicht einheitlich aufgebaut sind. Unterschiedliche Spaltenanzahl wäre eins der Kriterien.
Ich vermute aber mal, Du meinst kein großes PDF Dokument mit 40 Tabellen, sondern einen Ordner mit 40 PDF-Dateien?
Zu Deinen Fragen: 1. Jein. Prinzipiell ja, aber... Menü Daten --> Daten abrufen --> Aus Datei --> Aus Ordner Das aber sehe ich z. Bsp. bei meinen Kontoauszügen von der Sparkasse, die ich per pdf erhalte. Das klappt, je nach Datenqualität, nicht wirklich zu 100%. Selbst bei den Kontoauszügen, die eigentlich einheitlich sein sollten, ist Nacharbeit angesagt. Das dürfte ohne tiefgreifendere Kenntnisse schwer bis unmöglich zu machen sein. Aber... es wäre ein Anfang... :) Möglich ist es aber.... inzwischen brauche ich für meine Kontoauszüge nur noch einen Klick... 2. Wenn Du die Daten nicht mit Pivot auswerten willst, keine Measures oder DAX Formeln brauchst, kannst Du das Laden ins Datenmodell deaktivieren. 3. Du kannst nichts falsch oder kaputt machen. PQ liest nur die Quelldaten ein, verändert sie aber nicht. Falls Du feststellst, dass Du in PQ was falsch gemacht hast, kannst Du entweder Einzelschritte oder ganze Abfragen löschen/verschieben/ändern. Das betrifft dann jedoch n ur die PQ Abfragen. Die Originaldaten bleiben in jedem Fall von allen in PQ ausgeführten Aktionen unberührt.
Falls es aber doch ein PDF Dokument mit 40 Tabellen ist, auch da ließe sich was machen. Doch im Prinzip gilt das oben gesagte. Da musst Du Hand anlegen. Dynamisieren lässt sich alles.... macht sich aber nicht von allein...
Der sicherste Ansatz für einen Irrtum ist der Glaube, alles im Griff zu haben. Nur, weil ich den Recorder bedienen kann, macht mich das noch lange nicht zum Musiker.
Ciao, Ralf
Folgende(r) 1 Nutzer sagt Danke an Ralf A für diesen Beitrag:1 Nutzer sagt Danke an Ralf A für diesen Beitrag 28 • franky29
vielen Dank für deine Antwort. Es ist tatsächlich *ein* Dokument (eine Hausgeldabrechnung) mit 40 Tabellen. Wenn ich dort den Inhalt kopiere und in Excel einfüge, ist leider alles in einer Zelle. Deshalb habe ich den Weg über Daten/Daten abrufen/aus Datei ausprobiert. Das Ergebnis sieht auf den ersten Blick super aus, weil Tabellen und Datenformate weitgehend richtig erkannt werden. Meine Herausforderung besteht also nur darin, sie aus dem Bereich "Abfragen und Verbindungen" in ein normales Tabellenblatt zu bekommen.
04.09.2025, 09:56 (Dieser Beitrag wurde zuletzt bearbeitet: 04.09.2025, 09:56 von Ralf A.)
(04.09.2025, 09:03)franky29 schrieb: Das Ergebnis sieht auf den ersten Blick super aus, weil Tabellen und Datenformate weitgehend richtig erkannt werden. Meine Herausforderung besteht also nur darin, sie aus dem Bereich "Abfragen und Verbindungen" in ein normales Tabellenblatt zu bekommen.
...das ist noch lange nicht das Ergebnis. Das ist quasi eie Vorschau dafür, welche Datenbereiche im Dokument erkannt wurden. Ums transformieren kommst Du da nicht herum. Im Navigator musst Du den Haken bei "Mehrere Elemente" setzen und auch für die Tabellen, deren Daten importiert werden sollen. Danach Daten transformieren lassen.
Auch wenn PQ schon viel selbständig macht, gerade in Fällen wie Deinem (unterschiedliche Strukturen der Tabellen) wirst Du nacharbeiten müssen. Wenn das Dein 1. Versuch mit PQ ist, mach ich Dir da aber wenig Hoffnung. Egal... wenn alles erledigt ist, lässt Du die Abfrage über "Laden in..." in ein Tabellenblatt Deiner Wahl laden....
Das kannst Du direkt im PQ Editor über die entsprechende Auswahl in "Schließen und laden..." oder aus Excel heraus => Daten --> Abfragen und Verbindungen --> Rechtsklick auf die entsprechende Abfrage und Laden in aus dem Submenü anklicken. Tabelle und Zielzelle auswählen .... fertig....
Dein eigentliches Problem wird jedoch vermutlich die Kombination all der unterschiedlichen Datenquellen sein...
Der sicherste Ansatz für einen Irrtum ist der Glaube, alles im Griff zu haben. Nur, weil ich den Recorder bedienen kann, macht mich das noch lange nicht zum Musiker.
Ciao, Ralf
Folgende(r) 1 Nutzer sagt Danke an Ralf A für diesen Beitrag:1 Nutzer sagt Danke an Ralf A für diesen Beitrag 28 • franky29
04.09.2025, 10:16 (Dieser Beitrag wurde zuletzt bearbeitet: 04.09.2025, 10:17 von ws-53.)
Wenn die 40 Tabellen von der Struktur identisch sind, dann ist es eigentlich überhaupt kein Problem, die Auswertung sehr elegant und dynamisch zu erstellen.
Du musst halt mal eine anonymisierter Mustermappe erstellen, die 2 oder 3 Tabellen enthält. Wichtig ist dabei, dass diese Mustermappe zu 100% dem Original entspricht.
Sofern es 2 Unterschiedliche Strukturen (Wohnung / Tiefgarage) sind, ist auch dies kein Problem, muss halt dann in der anonymisierten Mustermappe auch so erkennbar sein.
04.09.2025, 10:28 (Dieser Beitrag wurde zuletzt bearbeitet: 04.09.2025, 10:29 von Ralf A.)
(04.09.2025, 10:16)ws-53 schrieb: Wenn die 40 Tabellen von der Struktur identisch sind, dann ist es eigentlich überhaupt kein Problem...
...genau das, schrieb franky gleich im Eröffnungspost, ist nicht der Fall:
Zitat:ich habe ein großes PDF-Dokument in dem 40 Tabellen mit unterschiedlicher Spaltenzahl verteilt sind.
Kann ja durchaus sein, dass sich einige der Tabellen auch noch über unterschiedlich viele Seiten verteilen.... bei pdf's ist das durchaus von Relevanz. Das mit den Seiten ist jetzt aber Spekulation.
Der sicherste Ansatz für einen Irrtum ist der Glaube, alles im Griff zu haben. Nur, weil ich den Recorder bedienen kann, macht mich das noch lange nicht zum Musiker.
Wenn eine anonymisierte Mustermappe zur Verfügung gestellt wird, die alle Besonderheiten enthält, die zu beachten sind. lässt sich konkret helfen. Andernfalls kann der TS ja auch einen externen Dienstleister beauftragen, von dem er sich vorher eine Verschwiegenheitserklärung unterschreiben lässt.
Zitat:Im Navigator musst Du den Haken bei "Mehrere Elemente" setzen
Der Navigator ist hier wohl der Bereich "Abfragen und Verbindungen". Dort finde ich keine Möglichkeit für "Mehrere Elemente".
Zitat:Danach Daten transformieren lassen.
Das ist dann vermutlich im PQ Editor. Dort habe ich im Tab "Transformieren" sehr viele Möglichkeiten, von "gruppieren nach" bis Datentyp erstellen. Einfach nur "transformieren" finde ich dort nicht.
Aber ist auch egal, ich habe euch genug beansprucht. Ich muss mich wirklich einmal mit PQ beschäftigen und dann wird sich alles klären. Für diese PDF experimentiere ich nun noch etwas herum und wenn es nicht klappt, mache ich halt einfach den "Klickmarathon" für jede Tabelle. Der klappt ja wie gewünscht.