Scansione: differenze tra le versioni

Scansione (visualizza wikitesto)

Versione delle 18:41, 24 gen 2019

2 824 byte aggiunti , 24 gen 2019

nessun oggetto della modifica

Pol

Burocrati, Amministratori, wegan

115

contributi

@@ Riga 35: / Riga 35: @@
 L'output di scantailor sono una serie di immagini tiff che possono essere compattate in un unico .pdf generando prima una .tiff multipagina:
-<code>$ tiffcp out_di_scantailor/*.tiff multipage.tiff</code>
+<code>$ tiffcp out_di_scantailor/*.tif multipage.tif</code>
+Probabilmente vorrai dare un'aggiustatina alla dimensione di ogni immagine, in particolare se hai scelto di lavorare su un progetto a risoluzione molto alta. Se vuoi riscalare del 60% le tue immagini puoi dare un comando del genere:
+<code>$ for i in *.tif; convert -resize 60% $i "${i%.tif}_2.tif";</code>
+che genererà in output le immagini ridimensionate mettendoci un _2 alla fine.
-e poi convertendola in un pdf:
+Puoi infine procedere a creare il tuo pdf:
 <code>$ tiff2pdf multipage.tiff megapdf.pdf</code>
+====Troubleshooting====
+Il ciclo for fallisce con l'errore:
+<code> convert: attempt to perform an operation not allowed by the security policy `PDF' </code>
+È necessario modificare le regole di policy di Imagemagick 7 nel file <code>/etc/ImageMagick-7/policy.xml</code>, <b>commentando</b> la seguente riga:
+<code> <policy domain="coder" rights="none" pattern="{PS,PS2,PS3,EPS,PDF,XPS}" /> </code>
 ===Briss===
@@ Riga 47: / Riga 62: @@
 dalla cartella dove si è scompattato il software.
+== METADATI ==
+è tutto una bozza qui quando ho un attimo di tempo lo metto apposto
+pdf -> usa exiftool
+djvu -> usa djvused (per djvu non c'è uno standard sui tag da utilizzare)
+tips per anonimizzare il tuo file:
+usa MAT (Metadata Anonymizer Tool)
+oppure per un PDF:
+<code>$ exiftool -overwrite_original -t -Creator="" -CreateDate="" -CreatorTool="" -Producer="" -DocumentID="" -InstanceID="" -SigningAuthority="" topsecretsegretissimofile.pdf </code>
+mentre per un DJVU:
+<code>$ djvused -v topsecretsegretissimofile.djvu -e "remove-meta; save" </code>
 == OCR ==
@@ Riga 69: / Riga 103: @@
 === Pagine Doppie ===
-Capita di trovare documenti .pdf che siano scansioni di buona qualità oppure file vettoriali, ma che siano a doppia pagina. Nel caso in cui si tratti di una scansione, è possibile procedere con scantailor, trattanto ogni pagina per l'immagine che è. Nel caso in cui si abbia a che fare con file vettoriali, si vuole normalmente conservare l'informazione vettoriale. Si può procedere con pdfcrop:
+Capita di trovare documenti .pdf che siano scansioni di buona qualità oppure file vettoriali, ma che siano a doppia pagina. Nel caso in cui si tratti di una scansione, è possibile procedere con scantailor, trattanto ogni pagina per l'immagine che è. Nel caso in cui si abbia a che fare con file vettoriali, si vuole normalmente conservare l'informazione vettoriale. Si può procedere con pdfcrop sulle singole pagine. In primo luogo si può individuare la porzione di file che ha le pagine doppie e isolarla, che nell'esempio seguente è tra la pagina 2 e la fine del libro:
+<code>$ pdftk libro.pdf cat 2-end output partial.pdf</code>
+A questo punto è possibile separare il file in tanti pdf a pagina singola:
+<code>$ mkdir workdir && cd workdir && pdftk ../partial.pdf burst</code>
+È poi possibile dare su ogni singolo file il seguente comando:
 <code>$ pdfcrop --bbox "<left> <bottom> <right> <top>" input.pdf output.pdf</code>
+I margini da inserire possono essere ricavati, elencati nello stesso ordine, dando il comando:
+<code>$ pdftk input.pdf dump_data | grep PageMediaRect</code>
+Se, ad esempio, dopo aver separato il pdf nelle pagine singole l'ultimo comando restituisce:
+<code>$ pdftk pg_0001.pdf dump_data | grep PageMediaRect
+PageMediaRect: 0 0 935.433 680.315</code>
+Per le pagine sinistre si dà:
+<code>$ for i in *.pdf; do pdfcrop --bbox "0 0 467.7165 680.315" $i ../"${i%.pdf}_L.pdf"; done</code>
+Mentre per le pagine destre si dà:
+<code>$ or i in *.pdf; do pdfcrop --bbox "467.7165 0 935.433 680.315" $i ../"${i%.pdf}_R.pdf"; done</code>
+A questo punto si possono riunire le pagine destre e sinistre:
+<code>$ mkdir separate && mv *_L.pdf separate/ && mv *_R.pdf separate && mv separate && pdftk *.pdf cat output prefinal.pdf</code>
+A questo punto si unisce la prima pagina del file iniziale al file finale:
+<code>$ pdftk libro.pdf cat 1 separate/prefinal.pdf cat output completoseparato.pdf </code>
 ==Condivisione==

Scansione: differenze tra le versioni

Scansione (visualizza wikitesto)

Versione delle 18:41, 24 gen 2019

Menu di navigazione

Ricerca