Dieses Forum nutzt Cookies
Dieses Forum verwendet Cookies, um deine Login-Informationen zu speichern, wenn du registriert bist, und deinen letzten Besuch, wenn du es nicht bist. Cookies sind kleine Textdokumente, die auf deinem Computer gespeichert werden. Die von diesem Forum gesetzten Cookies werden nur auf dieser Website verwendet und stellen kein Sicherheitsrisiko dar. Cookies aus diesem Forum speichern auch die spezifischen Themen, die du gelesen hast und wann du zum letzten Mal gelesen hast. Bitte bestätige, ob du diese Cookies akzeptierst oder ablehnst.

Ein Cookie wird in deinem Browser unabhängig von der Wahl gespeichert, um zu verhindern, dass dir diese Frage erneut gestellt wird. Du kannst deine Cookie-Einstellungen jederzeit über den Link in der Fußzeile ändern.

Daten aus PDF in eine vorgefertige Excel Tabelle ziehen
#1
Question 
Hallo zusammen,

ich bin neu im Forum und auch neu bei Excel und habe folgendes Problem:

Ich habe eine PDF Datei (keine Bilder, echter Text, laesst sich kopieren), und eine bereits vorgefertigte Excel Tabelle.

Die PDF Datei hat folgenden Aufbau. Paragraph, dann ein Datum im Textformat, dann einen kleinen Text. Alles steht hintereinander, und ist nur durch Bindestriche getrennt. Danach wieder das selbe. Und das auf circa 500 Seiten.

In Excel soll ich nun Paragraphennummer, Datum, und Text in den Spalten dafuer eintragen. Momentan mache ich das umstaendlich per Kopieren und einfuegen.

Gibt es dort auch eine andere Moeglichkeit? Es waere mir echt eine grosse Hilfe.

Vielen Dank im Voraus
Antworten Top
#2
Hi,

nach dem Einfügen ins Tabellenblatt gehe zu Daten==> Text in Spalten==> Trenner: Bindestrich
Gruß Günter
Jeder Fehler erscheint unglaublich dumm, wenn andere ihn begehen.
angebl. von Georg Christoph Lichtenberg (1742-1799)
Antworten Top
#3
Vielen Dank fuer deine Antwort, das wuerde jedoch mein Problem nur fuer einen Absatz loesen. Ich habe jedoch circa 10.000 solcher.

Gibt es da eine Rundum-Loesung?
Antworten Top
#4
Hi,

Zitat:das wuerde jedoch mein Problem nur fuer einen Absatz loesen.

das verstehe ich nicht. Huh

Du kannst doch alles aus deiner PDF ins Excel kopieren, danach alles markieren und wie oben beschrieben verfahren.
Gruß Günter
Jeder Fehler erscheint unglaublich dumm, wenn andere ihn begehen.
angebl. von Georg Christoph Lichtenberg (1742-1799)
Antworten Top
#5
Hallo,

die Absaetze selbst sind ja nicht per Bindestrich getrennt. Ich zeige das mal.


Angehängte Dateien Thumbnail(s)
   
Antworten Top
#6
Hi,

lade bitte eine (!) Seite der PDF-Datei hoch (http://www.clever-excel-forum.de/thread-326.html), damit ich das unter realen Bedingungen testen kann.
Gruß Günter
Jeder Fehler erscheint unglaublich dumm, wenn andere ihn begehen.
angebl. von Georg Christoph Lichtenberg (1742-1799)
Antworten Top
#7
Anbei eine Seite. Der Text eines Paragraphen kann, wie man hier sieht, auch auf zwei Seiten sein. Ich freue mich sehr ueber jegliche Antwort.


Angehängte Dateien
.pdf   test.pdf (Größe: 32,15 KB / Downloads: 9)
Antworten Top
#8
Hi,

sobald ich den kopierten Text ins Excel eingefügt habe, stellt es sich mir so dar:

Tabelle1

ABC
1Decreto Supremo 22129 15 de febrero de 1989 Las importaciones
2relativas y a las adjudicaciones efectuadas por Yacimientos Petrolíferos Fiscales
3Bolivianos con anterioridad al 17 de agosto de 1988 por licitaciones o invitaciones
4públicas o directas convocadas por dicha empresa estatal o sus agencias de
5compras, se regirán por las normas legales vigentes con anterioridad a la
6dictación del decreto supremo 21979 de 5 de agosto de 1988.
7Decreto Supremo 22044 05 de octubre de 1988 Aprueba la adjudicación
8en favor de la Empresa Boliviana de Comercio Ltda. (EBCO LTDA.) representante
9de Alfredo Evangelista y Cía SACI y C. de la Argentina, para provisión de seis (6)
10tanques atmosféricos de techo cónico para almacenamiento de petróleo crudo y
11mezclas de petróleo crudo y condensado, incluyendo agitadores, medidores de
12nivel, instrumentos y otros accesorios.
13Decreto Supremo 22027 19 de septiembre de 1988 Aprueba en favor
14de la compañía Servicios Aéreos Generales Helimar S.R.L, para la contratación de
15servicios de helicópteros para apoyos de trabajos sísmicos de la brigada portátil
16N° 2 de la Gerencia de Exploración.
17Decreto Supremo 22026 19 de septiembre de 1988 Autorizando la
18compra directa de periféricos marca WANG.

Excel Tabellen im Web darstellen >> Excel Jeanie HTML 4.8

Das Datum wird automatisch in Spalte B geschrieben. In Spalte C steht der Anfang des Textes, der bereits zeilenweise in Spalte A eingefügt wurde.

Ich sehe leider keine Möglichkeit, mit Bordmitteln dein Vorhaben zu lösen, da die Texte in unterschiedlich vielen Zeilen aufgeteilt sind. Ob eventuell mit Makros, sofern du sie einsetzen darfst/willst, geht, müssen dir aber unsere Spezalisten sagen.
Gruß Günter
Jeder Fehler erscheint unglaublich dumm, wenn andere ihn begehen.
angebl. von Georg Christoph Lichtenberg (1742-1799)
Antworten Top
#9
Hallo,

bei einem Test von Hand würden die Texte recht sauber in den Zellen der Spalte A abgelegt. Diese könnte per Makro in 3 Spalten für Paragraph, Datum und Text umgesetzt werden. Kriterium wäre Schriftart "fett" für die Paragraphen.

D.h., die Struktur darf nicht vorgegeben sein, sondern entsteht mit dem Makro.

mfg


Angehängte Dateien
.xlsx   Paragraph.xlsx (Größe: 11,84 KB / Downloads: 4)
Antworten Top
#10
Hallo,

wenn die Daten aus dem pdf so wie in meinem vorher hochgeladenen Sheet stehen, hilft dieser Code, die (hoffentlich) gewünschte Spaltenstruktur zu erzeugen:


Code:
Sub Paragr()
Columns("A:B").Insert
lr = Cells(Rows.Count, "C").End(xlUp).Row
For i = 1 To lr
   If Cells(i, "C").Font.Size = 15 Then
       Cells(i, "C").Offset(2, -2) = Cells(i, "C")
       Cells(i, "C").Offset(2, -1) = Cells(i + 1, "C")
       Range("C" & i & ":C" & i + 1).Clear
   End If
Next i
End Sub


mfg
Antworten Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste