Home Hardware Networking Programmazione Software Domanda Sistemi
Conoscenza Informatica >> software >> produttività Software >> .

PDF a txts in Ubuntu

Ubuntu fornisce strumenti grafici e di riga di comando per convertire i file PDF (Portable Document ) in formato testo. La versione a linea di comando , " pdftotext " , automatizza il processo inserendo il comando di conversione in uno script di shell . In questo modo , più file PDF possono essere modificati contemporaneamente . Un certo numero di opzioni della riga di comando forniti con il comando enable azioni specifiche (come solo convertendo le prime pagine ), che si terrà ogni volta che viene eseguito . Ottenere pdftotext

ottenere i pacchetti e di comando " pdftotext " dalle librerie di Ubuntu tramite il comando appropriato :

sudo apt- get install poppler - utils

Assicurarsi che il pacchetto viene installato correttamente prima di utilizzarlo .
pdftotext Man Pagina

Scopri come funziona il comando pdftotext e familiarizzare con le opzioni della riga di comando disponibili . Guarda la pagina man per il comando immettendo " uomo pdftotext " al prompt dei comandi di shell , e premere "Invio " . Le opzioni della riga di comando sono costituiti da lettere, precedute da un trattino , ad esempio " -l" , e tutti offrono funzioni diverse .

Il comando standard per pdftotext è " pdftotext " (senza virgolette) , dove è il nome del file PDF per estrarre , come " report.pdf " e è il nome del file di output di testo , come ad esempio " report.txt " . È possibile utilizzare qualsiasi nome di vostra scelta .
Batch PDF Conversion

prova il comando provandolo su un paio di file PDF individualmente . Se va bene si consiglia di provare a utilizzare un certo numero di file PDF in script di shell per automatizzare il processo . Un esempio di uno script tipico è la seguente :

for i in * pdf

fare

pdftotext $ i $ i.txt

fatto < . br>

Questo script prende tutti i file PDF nella directory corrente e li esporta con il loro nome ad un file di testo , in modo da " report.pdf " diventerebbe " report.pdf.txt "

file PDF protetti

Alcuni file PDF sono protetti sia con password o impostati per impedire l'esportazione di testo dal documento . Questo è un tentativo di proteggere i diritti d'autore e , se questo è il caso , forse fareste meglio a riconsiderare la conversione da un punto di vista legale. Se hai la password per un file PDF , questo può essere superato nelle opzioni della riga di comando per " pdftotext " .

 

software © www.354353.com