Anzeige
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Excel aus mehreren PDFs mit Powerquery korrekt anlegen

Forumthread: Excel aus mehreren PDFs mit Powerquery korrekt anlegen

Excel aus mehreren PDFs mit Powerquery korrekt anlegen
19.09.2024 12:00:02
Roger74
Hallo,
hatte schon einmal geschrieben, jetzt vllt. besser erklärt - ich möchte gerne PDF Dateien in eine Excel Datei mit Powerquery erstellen. Die PDF Dateien sind Tagesprotokolle, die ich angelegt habe. In den Tagesprotokollen sind kleine, große Textfelder, Dropdownfelder und Checklisten zum Abhaken. Jeden Tag werden diese Tagesprotokolle ausgefüllt und ich möchte die Daten in einer Übersicht Exceldatei sammeln und evtl. weiter bearbeiten.
Mittlerweile habe ich die PDF Dateien mit dem ein oder anderen Textfeld erweitert, bzw. gelöscht, sind also nicht durchgehend gleich.
Mein Problem bei Powerquery (Erstellung einer Excel) ist aber, daß bei der PDF Datei für jedes Feld eine Zeile untereinander angelegt wird mit dem Namen vom Feld, aber ohne Daten!
Ich hätte gerne in der Powerquery (Excel) alle Daten der einzelnen PDFs untereinander, aber in einer Zeile.
Die Textfeldnamen in der ersten Zeile ganz oben und darunter alle Textfeld Daten der jeweiligen PDFs.
Aber bitte bedenken die PDF Dateien sind mit der Zeit unterschiedlich in der Anzahl der Textfelder.
Was mache ich falsch bei den Einstellungen bei der Erstellung, damit diese Daten korrekt angezeigt werden?
Transformieren, Dateien kombinieren, ..?
Gibt es eine Anleitung oder ein Youtube Video?


Danke vorab
Roger
Anzeige

2
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Excel aus mehreren PDFs mit Powerquery korrekt anlegen
19.09.2024 12:28:00
Eifeljoi 5
Hallo

Habe gerade mein Glasauge verloren oder soll jemanden vorbeikommen?
Wenn letztes dann genaue Adresse oder PDFS und deine bisherigen Schritte und deinem Wunschergebnis.
AW: Excel aus mehreren PDFs mit Powerquery korrekt anlegen
19.09.2024 12:31:39
Yal
Hallo Roger,

Wenn Du alle PDF aus einem Verzeichnis liest, bekommst Du von PQ eine "Funktion". Darin spielt sich die Verarbeitung jeder einzelnen Datei.
Wenn Du eine 2-spaltige Liste von Felder (Feldname, Wert), dann musst Du nur die Spalte "Feldname" pivotieren und dabei die Spalte Wert als Wert-Spalte verwenden. Es ist zu achten, dass nach der Pivotierung keine Aktion ausgeführt wird, die an einem Feldname (was jetzt eine Spalte ist) festverbunden ist. Es würde zu einem Fehler führen, falls dieses Feld in einer Datei fehlt.

Die Haupt-Abfrage wird die Dateien aus dem Verzeichnis auflisten und jede einzelne der Funktion übergeben. Die Rückgabe wird Spalten herausgegeben. Wenn in einer Datei ein Feld vorkommt, dass in den anderen nicht gab, wird eine neue Spalte erzeugt.

Sollte es nicht der Fall sein, musst Du das Ergebnis der Dateiverarbeitungsfunktion in 2-Spaltige form zurückgeben und in der Hauptfunktion pivotieren. Was am Ende genau dasselbe Ergebnis liefert.

Das wohl meist-zitierte Tutorial ist https://excelhero.de/power-query/power-query-ganz-einfach-erklaert . Siehe Punkt 5 "Daten aus gesamten Ordnern abfragen" (es wird auch Unterordner gelesen. Wenn nicht gewünscht, sollten diese ausfiltert werden).

Weitere Ratschläge kann man ohne Beispieldatei kaum geben. Bei Protokoll-PDF ist es blöd, weil sehr aufwendig, diese zu anonymisieren oder Dummy zu erzeugen.

VG
Yal
Anzeige

Forumthreads zu verwandten Themen

Anzeige
Anzeige
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige