Ahojte,
Nedavno som objavil jednu utilitku ktora vie konvertovat neobrazkove pdf,doc,docx,xls,xlsx,odt a este par dalsich formatov do txt. Vola sa xdoc2txt a jej velkou vyhodou je, ze ak ma po ruke jednu kniznicu (detaili vid nizsie) tak dokaze pri konverzii pdf privriet oci nad tym, ze pdf je chranene proti kopirovaniu. Pouzivatelia citacov obrazovky ju teda mozu pouzit na extrakt textu z pdf ktorych zabezpecenie je prilis restriktivne na to, aby sa k ich obsahu dokazal dostat citac obrazovky.
Za nevihodu tohoto programu mozno na druhej strane povazovat fakt, ze nema graficke pouzivatelske rozhranie, ovladat ho teda treba z prikazoveho riadka.
Ti z vas co by ste program radi pouzivali a prikazovy riadok je pre vas nepriatelsky, mozete urobit nasledovne (linky na vsetko potrebne su v strucnom navode):
- Program pouzit ako filter v lubovolnom suborovom spravcovi (free commander, total commander,...)
- Ak nepouzivate ziadneho spravcu suborov (len tento pocitac) tak si nastroj mozete rozbehat ako "drag and drop" nastroj. Navod ako to urobit a ako ho potom pouzivat nasleduje nizsie:
1. Program si mozete stiahnut zo stranky:
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.htmlPre tych co nevedia po japonsky (stranka aj s dokumentaciou k programu je len v tomto jazyku) a v dohladnej dobe si neplanuju doplnit medzery vo vzdelani

) pridavam aj priamy odkaz na archiv s programom:
http://hishida.s271.xrea.com/download/KWICFinder/d2txt139.zip2. archiv rozbalte na lubovolne miesto, je to "portable" aplikacia ktoru netreba instalovat. V navode predpokladam ze ju mame rozbalenu na disku d v priecinku xdoc2txt
3. Vyssie som spomenul, ze na to aby program vedel konvertovat chranene pdf je potrebna nejaka kniznica. Vola sa cryptlib a priama linka na stiahnutie je tu:
http://hishida.s271.xrea.com/download/KWICFinder/crypt100.lzhlinka ukazuje na archiv ktory stiahnite a ulozte do adresara kde mate rozbalenu utilitu. Archiv tam rozbalte. Dolezity je hlavne subor cryptlib.dll ktory musi byt v rovnakom adresary ako konvertor.
4. v poslednom kroku si potrebujeme vyrobit nieco, cez co budeme program presviedsat, aby nam konvertoval na txt to co mu podstrcime. v adresary v ktorom ste rozbalili oba archivy vytvorte prazdny textovy subor do ktoreho napiste / okopirujte 2 nasledujuce riadky:
@echo off
d:\xdoc2txt\xdoc2txt.exe -n -f "%1%"
subor ulozte pod nazvom xdoc2txt.bat
Pre veci znalych pridavam, ze ak program spustia bez parametrov, napise o sebe kratku informaciu, hlavne sa dozviete ake prepinace na prikazovom riadku pozna. Informacia je v anglictine.
a nakoniec este strucne o tom ako program teraz pouzit:
- otvorte si tento pocitac, kurzorom sa nastavte na pdf-ko ktore chcete konvertovat (moze to byt aj odt, docx,... co kolvek co je podporovane) a okopirujte ho do schranky.
- potom (opat cez tento pocitac) otvorte priecinok xdoc2txt na disku d a kurzorom sa nastavte na subor xdoc2txt.bat ktory sme vytvorili v bode 4.
- Nakoniec aktivujte polozku "prilepit" v kontextovej ponuke na subore. Pozor, nepouzivajte skratku ctrl+v, pretoze pomocou nej subor prekopirujete, ak pouzijete polozku v kontextovom menu, dosiahnete to, ze subor v schranke bude programu predany ako parameter rovnako ako sa to da urobit pomocou mysacieho drag and drop.
- Vysledny txt subor najdete v tom istom priecinku, v ktorom sa nachadza povodne pdf.
Vyssie opisany navod je taky komplikovany, pretoze licencia k programu (ano, ano, opat v japoncine, google translate pomohol)neumoznuje bezplatne si vytvarat a distribuovat upravene kopie programu.