Dieses Forum nutzt Cookies
Dieses Forum verwendet Cookies, um deine Login-Informationen zu speichern, wenn du registriert bist, und deinen letzten Besuch, wenn du es nicht bist. Cookies sind kleine Textdokumente, die auf deinem Computer gespeichert werden. Die von diesem Forum gesetzten Cookies werden nur auf dieser Website verwendet und stellen kein Sicherheitsrisiko dar. Cookies aus diesem Forum speichern auch die spezifischen Themen, die du gelesen hast und wann du zum letzten Mal gelesen hast. Bitte bestätige, ob du diese Cookies akzeptierst oder ablehnst.

Ein Cookie wird in deinem Browser unabhängig von der Wahl gespeichert, um zu verhindern, dass dir diese Frage erneut gestellt wird. Du kannst deine Cookie-Einstellungen jederzeit über den Link in der Fußzeile ändern.

Daten aus pdf-Dateien nach Excel exportieren
#1
Tongue 
Hallo zusammen! Mein erster Beitrag hier! Ich hoffe, ich mache nicht zuviel falsch. Wink

Ich kann mir bisher dass, was ich benötige mit Formeln etc. selbst zusammenstellen, scheitere jedoch an der derzeitigen Problematik, die nicht nur Excel beinhaltet. 

Folgende Ausgangssituation:

Ich habe ca. 600 pdf-Dateien (Gewerberegisterauszüge), die ich nach Excel exportieren möchte. Das funktioniert zwar grundsätzlich über Adobe Acrobat Reader DC, jedoch scheitert es daran, dass dann die Informationen aus der pdf-Datei zum großen Teil in einer Excel-Zelle ohne Format erscheinen. Gibt es eine Möglichkeit, dass man die Daten nach dem Konvertieren von pdf nach Excel mittels VBA so anordnet bzw. aufbereitet, dass man entsprechende Spalten mit Überschrift und der jeweiligen Zeile befüllen kann?

Beispiel-pdf's kann ich aufgrund DVSGO nicht hochladen, jedoch eine Beispieldatei, wie das pdf grundsätzlich aufgebaut ist und wie es nach dem Konvertieren in Excel aussieht.

Das Problem ist, dass ich mich mit VBA oder was auch immer überhaupt nicht auskenne... 22

Vielen lieben Dank im Voraus für Eure Hilfe.


Angehängte Dateien
.pdf   pdf - excel.pdf (Größe: 87,5 KB / Downloads: 8)
Antwortento top
#2
Hallo,

vielleicht geht es prinzipiell, aber ob das mit den Restriktionen eines Forums ohne Original-Dateien geht, ist fraglich.

Versuche es zuerst in MS Word zu importieren. Da ist der PDF-Importfilter besser. Von einer Word-Tabelle nach Excel zu transferieren, gilt als einfach.

Aber ohne VBA geht das nicht.

mfg
Antwortento top
#3
Hallo Fennek,

danke für die schnelle Rückmeldung. Export nach Word sieht in der Tat "nutzbarer" aus. Hilft es, wenn ich dieses Word-Dokument hochlade (die Daten der Firma würde ich in Mustermann anpassen)? Das würde das Format nicht verändern und ich könnte Hilfe dabei bekommen, wie es von Word nach Excel kommt. Wink
Antwortento top
#4
ja

(es fehlen noch 3 Zeichen, damit die Nachricht verschickt werden kann)
Antwortento top
#5
Im Anhang das Word-Dokument! 

Daraus benötige ich aber auch nicht alle Daten. Wenn man das direkt berücksichtigen könnte, wäre es klasse, ansonsten sind auch alle Daten in Ordnung.

Ich benötige lediglich:

- Unternehmen (in einer Zelle)
- Standort (in einer Zelle)
- Adresse (in 4 Zellen Straße, Hausnummer, PLZ und Ort)
- Telefon (in einer Zelle)
- E-Mail (in einer Zelle)
- Funktion (in einer Zelle)
- Person (in drei Zellen Anrede, Vor-, Nachname)
- geboren (in einer Zelle)


Angehängte Dateien
.docx   Daten pdf - word.docx (Größe: 34,73 KB / Downloads: 6)
Antwortento top
#6
Hallo Sebastian,

vermutlich war es keine gute Idee, das Format in Word ist "gruselig".

Der folgende Code liest die gewünschten Information aus:

MS Word-VBA:

Code:
Type Adr
    Unternehmen As String
    Standort    As String
    Adresse     As String
    Tel         As String
    Funktion    As String
    Person      As String
    geboren     As String
End Type
Sub F_en()
Dim Info As Adr

With ThisDocument
    For i = 1 To .Paragraphs.Count
    Para = Split(.Paragraphs(i).Range.Text, vbTab)
        Select Case Para(0)
            Case Is = "Unternehmen": Info.Unternehmen = Para(1)
            Case Is = "Standort": Info.Standort = Para(1)
            Case Is = "Adresse": Info.Adresse = Para(1)
            Case Is = "Telefon": Info.Tel = Para(1)            
        End Select
    Next i
End With
Debug.Print Info.Unternehmen, Info.Standort, Info.Adresse, Info.Tel
End Sub

Sub T_1()
With ThisDocument.Sections(3)
    Debug.Print .Range.Text
End With
End Sub

Das Risiko so etwas mit jemanden, der wenig Grundwissen in VBA mitbringt, zu entwickeln, erscheint mir als zu hoch.

Eine Alternative könnte es sein, die PDF mit htt[x]://www[.]xpdfreader.com/download.html in Ascii-Text auszulesen und diesen direkt in Excel zu importieren.

mfg
Antwortento top
#7
Ok, da bin ich echt ein absoluter Laie. Wo müsste ich denn wie das MS Word VBA einfügen? Huh

Alternativ würde ich das mit dem Tool mal versuchen, dass du vorgeschlagen hast.
Antwortento top
#8
Habe es mal in die Word-Datei mit den Originaldaten eingefügt. Beim Ausführen des Makros erscheint folgende Fehlermeldung: siehe Anhang.


Angehängte Dateien Thumbnail(s)
   
Antwortento top
#9
Hallo, 19

im Anhang mal ein Beispiel für Excel (über Word): 21

.zip   PDF_ausleasen.zip (Größe: 111,99 KB / Downloads: 16)

Entpacke die ZIP-Datei in einen Ordner und lasse das Makro in der Exceldatei rennen. Dodgy
________
Servus
Case
Antwortento top
#10
Hallo an alle Helfer!

Ich konnte Dank eines Hinweises über PN das Thema durch eine Power Query zufriedenstellend lösen. Ein wenig c&p hatte ich zwar noch, aber letztlich ging es damit sehr gut!

Danke Euch!
Antwortento top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste