Home Hardware Networking Programmazione Software Domanda Sistemi
Conoscenza del computer >> software >> Compressione dei dati >> .

In che modo la compressione del file influisce su txt?

La compressione del file influisce sui file TXT (file di testo in chiaro) riducendo le loro dimensioni. Ciò si ottiene sfruttando licenziamenti e schemi all'interno dei dati di testo. Diversi algoritmi di compressione ottengono questo in vari modi, ma il principio generale rimane lo stesso:

* Compressione senza perdita: Questo è il tipo più comune utilizzato per i file TXT. Gli algoritmi di compressione senza perdita garantiscono che il testo originale sarà perfettamente ricostruito dopo la decompressione. Funzionano identificando schemi ripetuti, sequenze di caratteri o altri dati prevedibili e sostituendoli con codici più brevi. Esempi includono:

* LZ77/LZ78 e i loro derivati ​​(ad esempio zip, gzip, 7z): Questi algoritmi trovano sequenze ripetute e li sostituiscono con puntatori a eventi precedenti, riducendo efficacemente la ridondanza.

* Coding Huffman: Questo algoritmo assegna codici più brevi a caratteri più frequenti e codici più lunghi a quelli meno frequenti, riducendo le dimensioni complessive.

* bzip2: Questo algoritmo utilizza una trasformazione a ruote di tane per riorganizzare i dati prima di applicare la codifica di Huffman, risultando in rapporti di compressione più elevati.

* Compressione perdita: Questo tipo di compressione è * non * utilizzato in genere per i file TXT. Le tecniche di compressione perdite scartano alcune informazioni per ottenere una maggiore riduzione delle dimensioni. Dal momento che scartare le informazioni in un file di testo cambierebbe il suo significato, questo non è pratico. Esempi di compressione perdita (che non sono idonei per txt) includono jpeg per immagini e mp3 per l'audio.

Quanta compressione si ottiene?

La quantità di compressione raggiunta da un file TXT dipende da diversi fattori:

* La dimensione del file originale: I file più grandi hanno generalmente più opportunità di ridondanza, consentendo rapporti di compressione più elevati.

* Il contenuto del file: Il testo altamente ripetitivo, come il codice con blocchi ripetuti o un documento con molte frasi ripetute, si comprimerà meglio del testo altamente casuale (come una stringa veramente casuale di caratteri).

* L'algoritmo di compressione: Algoritmi diversi hanno efficienze diverse. BZIP2 ottiene generalmente una compressione più elevata rispetto a GZIP, ma a costo della compressione più lenta e delle velocità di decompressione.

In breve, la compressione dei file per i file TXT li rende più piccoli per l'archiviazione e la trasmissione senza perdere dati. L'entità della riduzione delle dimensioni dipende dalla struttura intrinseca del testo e dall'algoritmo di compressione scelto.

 

software © www.354353.com