...Danke für den Hinweis. So gut, wie PQ sonst auch ist, aber so richtig empfehlenswert ist die Bildimportfunktion, wie schon erwähnt, ja eh nicht...
Eventuell wäre hier noch Tesseract zu erwähnen, das kann hOCR-Dateien ausgeben, die sich eventuell als HTML oder XML importieren lassen könnten ...
https://de.wikipedia.org/wiki/Tesseract_(Software)
Tesseract arbeitet in einigen kommerziellen Produkten als OCR-Engine (z. B. auch in PDF24).