pdf2djvu

Autres langues

Langue: pl

Autres versions - même langue

Version: 05/24/2010 (fedora - 01/12/10)

Section: 1 (Commandes utilisateur)

NAZWA

pdf2djvu - tworzy pliki DjVu z plik'ow PDF

SK/LADNIA

pdf2djvu [{-o | --outputplik-wyjściowy-djvu] [opcja...] plik-pdf
pdf2djvu {-i | --indirectplik-indeksowy-djvu [opcja...] plik-pdf
pdf2djvu {--version | --help | -h}

OPIS

Program ten tworzy plik DjVu na podstawie pliku pdf-file w formacie Portable Document Format.

OPCJE

pdf2djvu przyjmuje następujące opcje:

Typ dokumentu, nazwy plik'ow

-o, --output=plik-wyjściowy-djvu

Utw'orz spakowany dokument wielostronicowy. Zapisz wynik do wyjściowego-pliku-djvu zamiast na standardowe wyjście.

-i, --indirect=indeksowy-plik-djvu

Utw'orz rozdzielony dokument wielostronicowy. Jako nazwy pliku indeksowego użyj pliku-indeksowego-djvu; pliki sk/ladowe umieść w tym samym katalogu. Katalog musi istnieć z prawami do zapisu.

--pageid-template=szablon

Określa schemat nazewnictwa identyfikator'ow stron. Opis języka szablon'ow znajduje się w rozdziale BqJĘZYK SZABLON'OWrq.
Domyślny szablon to Bqp{page:04*}.djvurq.
Aby umożliwić przenośność, identyfikatory stron:
* muszą sk/ladać się tylko z ma/lych liter ASCII, cyfr, znak'ow _, +, - i kropki,
* nie mogą zaczynać się od kropki,
* nie mogą zawierać dw'och kropek z rzędu,
* muszą kończyć się rozszerzeniem .djvu lub .djv.

--pageid-prefix=prefiks

R'ownoważność Bq--pageid-template=prefiks{page:04*}.djvurq.

--page-title-template=szablon

Określa schemat tytu/l'ow stron. Opis języka szablon'ow znajduje się w rozdziale BqJĘZYK SZABLON'OWrq.
Domyślnie tytu/ly nie są ustawiane.

Rozdzielczość, wielkość strony

-d, --dpi=rozdzielczość

Określa, że pożądaną rozdzielczością jest rozdzielczość punkt'ow na cal. Domyślną wartością jest 300 dpi. Dopuszczalny zakres to: 72 < rozdzielczość < 6000.

--media-box

Do określenia rozmiaru strony użyj MediaBox. Domyślnie używane jest CropBox.

--page-size=szerokośćxwysokość

Określa, że preferowanym rozmiarem strony jest szerokość pikseli × wysokość pikseli. Faktyczny rozmiar strony może zostać zmieniony, by zachować proporcje obrazu i wymogi DjVu dot. rozdzielczości. (Ta opcja ma pierwszeństwo nad -d/--dpi.)

--guess-dpi

Spr'obuj odgadnąć pierwotną rozdzielczość poprzez ogląd osadzonych obraz'ow. Używać ostrożnie.

Jakość obrazu

--bg-slices=n+...+n, --bg-slices=n,...,n

Określa jakość kompresji warstwy t/la IW44. Opcja ta jest podobna do opcji -slice programu c44. Szczeg'o/ly znajdują się w podręczniku c44(1). Domyślną wartością jest 72+11+10+10.

--bg-subsample=n

Określa wsp'o/lczynnik podpr'obkowania t/la. Domyślną wartością jest 3. Dopuszczalne wartości to liczby ca/lkowite od 1 do 12 w/lącznie.

--fg-colors=default

Staraj zachować się wszystkie kolory pierwszego planu. Tak jest domyślnie.

--fg-colors=web

Zredukuj kolory pierwszego planu do palety WWW (216 kolor'ow). Ta opcja nie jest zalecana.

--fg-colors=n

Użyj GraphicsMagicka do zredukowania do n liczby r'ożnych kolor'ow na pierwszym planie. Dopuszczalne wartości to liczby ca/lkowite od 1 do 4080. Ta opcja nie jest zalecana.

--fg-colors=black

Odrzuć informacje o kolorach pierwszego planu.

--monochrome

Rastruj strony jako dwukolorowe bitmapy. W takim wypadku opcje --bg-... i --fg-... nie są respektowane.

--loss-level=n

Określa agresywność kompresji stratnej. Domyślną wartością jest 0 (kompresja bezstratna). Dopuszczalne wartości to liczby ca/lkowite od 0 do 200 w/lącznie. Opcja ta jest podobna do opcji -losslevel programu cjb2; szczeg'o/ly znajdują się w podręczniku cjb2(1) . Opcja ta jest respektowna tylko razem z opcją --monochrome.

--lossy

Synonim --loss-level=100.

--anti-alias

W/lącz antyaliasing font'ow i grafiki wektorowej. Ta opcja nie jest zalecana.

Wyodrębnianie

--no-metadata

Nie wyodrębniaj metadanych.
Domyślnie:
* Wyodrębniane są następujące has/la s/lownika informacji o dokumencie: Title, Author, Subject, Creator, Producer, CreationDate, ModDate. Zapisy daty i czasu są formatowane wg m[blue]RFC 3999m[][1], z datą i czasem oddzielonymi pojedynczą spacją.
Metadane XMP są wyodrębniane (lub tworzone) i odpowiednio aktualizowane.

--verbatim-metadata

Zachowaj oryginalne metadane bez zmian.

--no-outline

Nie wyodrębniaj konspektu dokumentu.

--hyperlinks=border-avis

Spraw, by ramki hiper/lączy by/ly zawsze widoczne.
Domyślnie ramka hiper/lącza jest widoczna tylko gdy nad nim znajduje się kursor myszki.

--hyperlinks=#RRGGBB

Wymuś określony kolor ramki hiper/lączy.

--no-hyperlinks, --hyperlinks=none

Nie wyodrębniaj hiper/lączy.

--no-text

Nie wyodrębniaj tekstu.

--words

Wyodrębniaj tekst. Zapisz po/lożenia każdego s/lowa. Tak jest domyślnie.

--lines

Wyodrębniaj tekst. Zapisz po/lożenia każdej linii, a nie każdego s/lowa.

--crop-text

Nie wyodrębniaj tekstu, kt'ory znajduje się poza granicami strony.

--no-nfkc

Nie poddawaj tekstu normalizacji m[blue]NFKCm[][2].

--filter-text=linia-poleceń

Przefiltruj tekst przez linię-poleceń. Dany filtr musi zachowywać bia/le znaki, znaki kontrole i cyfry dziesiętne.
Opcja ta implikuje --no-nfkc.

-p, --pages=zakres stron

Określa strony przeznaczone do konwersji. zakres-stron jest oddzielaną przecinkami listą podzakres'ow. Każdy podzakres to albo pojedyncza strona (np. 17), albo ciąg/ly zakres stron (np. 37-42). Strony numerowane są od 1.
Domyślnie konwertowane są wszystkie strony.

Wydajność

-j, --jobs=n

Użyj n wątk'ow do przeprowadzenia konwersji. Domyślnie używany jest jeden wątek.

-j0, --jobs=0

Określ liczbę wątk'ow używanych do przeprowadzenia konwersji automatycznie.

Gadatliwość, pomoc

-v, --verbose

Wyświetlaj więcej komunikat'ow informacyjnych podczas konwersji pliku.

-q, --quiet

Nie wyświetlaj komunikat'ow informacyjnych podczas konwersji pliku.

--version

Wyświetl informację o wersji i wyjdź.

-h, --help

Wyświetl pomoc i wyjdź.

ŚRODOWISKO

OMP_*

Zachowanie programu pod względem wsp'o/lbieżności można kontrolować za pomocą kilku zmiennych środowiskowych. Szczeg'o/ly opisane są w m[blue]specyfikacji API OpenMPm[][3].

JĘZYK SZABLON'OW

Sk/ladnia szablon'ow

Język szablon'ow jest z grubsza wzorowany na m[blue]sk/ladni formatowania napis'ow w języku Pythonm[][4].

Szablon to kawa/lek tekstu zawierający pola, otoczone klamrami {}. Kiedy szablon jest wyliczany, pola zastępowane są odpowiednio sformatowanymi wartościami. Ponadto ciąg {{ jest zastępowany pojedynczym { a ciąg }} --- pojedynczym }.

Sk/ladnia p'ol

Każde pole sk/lada się z nazwy zmiennej, po kt'orej opcjonalnie następuje przesunięcie, po kt'orym opcjonalnie następuje specyfikacja formatu.

Przesunięcie jest liczbą ca/lkowitą ze znakiem (tj. zaczynającą się znakiem + lub -).

Specyfikacja formatu sk/lada się z dwukropka, po kt'orym następuje specyfikacja szerokości.

Specyfikacja szerokości jest liczbą ca/lkowitą definiującą minimalną szerokość pola. W przypadku braku definicji, szerokość zostanie określona na podstawie treści. Poprzedzenie specyfikacji szerokości zerem (0) powoduje dope/lnianie zerami.

Po specyfikacji szerokości może opcjonalne nastąpić znak gwiazdki (*), kt'ory zwiększa minimalną szerokość pola do największej możliwej d/lugości zawartości zmiennej.

Dostępne zmienne

page, spage

Numer strony w dokumencie PDF.

dpage

Numer strony w dokumencie DjVu.

SZCZEG'O/LY IMPLEMENTACJI

Algorytm separacji warstw

Jeżeli nie użyto opcji --monochrome, pdf2djvu używa następującego naiwnego algorytmu separacji warstw:

1. Dla każdej strony wykonaj co następuje:
1. Zrastruj stronę do mapy pikseli w zwyk/ly spos'ob.
2. Zrastruj stronę do innej mapy pikseli, z pominięciem następujących element'ow strony:
* tekst,
* obrazy rastrowe o g/lębokości 1 bit na piksel,
* elementy wektorowe (opr'ocz wype/lnień o dużej powierzchni).
3. Por'ownaj obie mapy pikseli, piksel po pikselu:
1. Jeżeli kolory się zgadzają, zaklasyfikuj piksel jako część warstwy t/la.
2. W przeciwnym wypadku, zaklasyfikuj piksel jako część pierwszego planu.

RAPORTY O B/LĘDACH

B/lędy znalezione w pdf2djvu proszę zg/laszać w m[blue]systemie śledzenia problem'owm[][5].

ZOBACZ TEŻ

djvu(1), djvudigital(1), csepdjvu(1)

AUTOR

Jakub Wilk <jwilk@jwilk.net>

Autor.

Copyright © 2007, 2008, 2009, 2010 Jakub Wilk

PRZYPISY

1.
RFC 3999
http://www.ietf.org/rfc/rfc3339
2.
NFKC
http://unicode.org/reports/tr15/
3.
specyfikacji API OpenMP
http://openmp.org/wp/openmp-specifications/
4.
sk/ladni formatowania napis'ow w języku Python
http://docs.python.org/library/string.html#format-string-syntax
5.
systemie śledzenia problem'ow
http://code.google.com/p/pdf2djvu/issues/