Home Hardware Networking Programmazione Software Domanda Sistemi
Conoscenza Informatica >> software >> Portable Document Format >> .

Come fare il parsing di documenti PDF in Java

file PDF forniscono un formato standard di codice aprire e analizzare i dati di un documento di sola lettura . È possibile utilizzare le librerie PDF Java per aprire un documento e leggere le informazioni contenute all'interno . È memorizzare queste informazioni in un database o di visualizzare le informazioni di nuovo al lettore nella vostra applicazione Java . Istruzioni
1

destro del mouse sul file di Java che si desidera utilizzare per analizzare le informazioni in formato PDF . Fare clic su " Apri con " e selezionare il vostro editor di Java .
2

importare la libreria lettore PDF . Aggiungere il codice riportato di seguito all'inizio del file Java per importare la libreria :

import com.asprise.util.pdf.PDFReader ;
3

aprire il file PDF . Il parser si trova nella classe " PdfReader " in biblioteca appena aggiunto. Aggiungere il seguente codice alla funzione che si desidera utilizzare per analizzare il file , sostituendo " thepdf.pdf " con il proprio nome di file PDF:

PdfReader pdf = new PdfReader ( new File ( " thepdf.pdf " ;) ) ; pdf.open ();
4

analizzare il testo dal file PDF . Il codice che segue analizza il contenuto dalla prima pagina nel PDF :

String pdfcontent = pdf.extractTextFromPage ( 0 ) ;

Sostituire la "0" con il numero di pagina che si desidera estrarre dal il file . La prima pagina inizia da 0 , in modo che ogni pagina indice aggiuntivo è il numero di pagina che si desidera estrarre meno 1 per compensare l'offset .
5

Chiudere il file dopo aver completato l'analisi dei dati . Il codice seguente chiude il file :

pdf.close ();

 

software © www.354353.com