Autor Téma: Konvertovanie chranenych pdf na txt  (Přečteno 6625 krát)

peter

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 339
    • Zobrazit profil
Konvertovanie chranenych pdf na txt
« kdy: 9. Květen 2011, 15:18:17 »
Ahojte,
Nedavno som objavil jednu utilitku ktora vie konvertovat neobrazkove pdf,doc,docx,xls,xlsx,odt a este par dalsich formatov do txt. Vola sa xdoc2txt a jej velkou vyhodou je, ze ak ma po ruke jednu kniznicu (detaili vid nizsie) tak dokaze pri konverzii pdf privriet oci nad tym, ze pdf je chranene proti kopirovaniu. Pouzivatelia citacov obrazovky ju teda mozu pouzit na extrakt textu z pdf ktorych zabezpecenie je prilis restriktivne na to, aby sa k ich obsahu dokazal dostat citac obrazovky.
Za nevihodu  tohoto programu mozno na druhej strane povazovat fakt, ze nema graficke pouzivatelske rozhranie, ovladat ho teda treba z prikazoveho riadka.
Ti z vas co by ste program radi pouzivali a prikazovy riadok je pre vas nepriatelsky, mozete urobit nasledovne (linky na vsetko potrebne  su v strucnom navode):
- Program pouzit ako filter v lubovolnom suborovom spravcovi (free commander, total commander,...)
- Ak nepouzivate ziadneho spravcu suborov (len tento pocitac) tak si nastroj mozete rozbehat ako "drag and drop" nastroj. Navod ako to urobit a ako ho potom pouzivat nasleduje nizsie:

1. Program si mozete stiahnut zo stranky:
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
Pre tych co nevedia po japonsky (stranka aj s dokumentaciou k programu je len v tomto jazyku) a v dohladnej dobe si neplanuju doplnit medzery vo vzdelani ;)) pridavam aj priamy odkaz na archiv s programom:
http://hishida.s271.xrea.com/download/KWICFinder/d2txt139.zip

2. archiv rozbalte na lubovolne miesto, je to "portable" aplikacia ktoru netreba instalovat. V navode predpokladam ze ju mame rozbalenu na disku d v priecinku xdoc2txt

3. Vyssie som spomenul, ze na to aby program vedel konvertovat chranene pdf je potrebna nejaka kniznica. Vola sa cryptlib a priama linka na stiahnutie je tu:
http://hishida.s271.xrea.com/download/KWICFinder/crypt100.lzh
linka ukazuje na archiv ktory stiahnite a ulozte do adresara kde mate rozbalenu utilitu. Archiv tam rozbalte. Dolezity je hlavne subor cryptlib.dll ktory musi byt v rovnakom adresary ako konvertor.

4. v poslednom kroku si potrebujeme vyrobit nieco, cez co budeme program presviedsat, aby nam konvertoval na txt to co mu podstrcime. v adresary v ktorom ste rozbalili oba archivy vytvorte prazdny textovy subor do ktoreho napiste / okopirujte 2 nasledujuce riadky:
@echo off
d:\xdoc2txt\xdoc2txt.exe -n -f "%1%"
subor ulozte pod nazvom xdoc2txt.bat
Pre veci znalych pridavam, ze ak program spustia bez parametrov, napise o sebe kratku informaciu, hlavne sa dozviete ake prepinace na prikazovom riadku pozna. Informacia je v anglictine.

a nakoniec este strucne o tom ako program teraz pouzit:
- otvorte si tento pocitac, kurzorom sa nastavte na pdf-ko ktore chcete konvertovat (moze to byt aj odt, docx,... co kolvek co je podporovane) a okopirujte ho do schranky.
- potom (opat cez tento pocitac) otvorte priecinok xdoc2txt na disku d a kurzorom sa nastavte na subor xdoc2txt.bat ktory sme vytvorili v bode 4.
- Nakoniec aktivujte polozku "prilepit" v kontextovej ponuke na subore. Pozor, nepouzivajte skratku ctrl+v, pretoze pomocou nej subor prekopirujete, ak pouzijete polozku v kontextovom menu, dosiahnete to, ze subor v schranke bude programu predany ako parameter rovnako ako sa to da urobit pomocou mysacieho drag and drop.
- Vysledny txt subor najdete v tom istom priecinku, v ktorom sa nachadza povodne pdf.

Vyssie opisany navod je taky komplikovany, pretoze licencia k programu (ano, ano, opat v japoncine, google translate pomohol)neumoznuje bezplatne si vytvarat a distribuovat upravene kopie programu.
Peter Lecký, Stopka n.o.

ondrej_rosik

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 447
    • Zobrazit profil
    • blog
Re:Konvertovanie chranenych pdf na txt
« Odpověď #1 kdy: 10. Červenec 2013, 12:38:23 »
Pri pokuse konvertovať súbor, ktorý obsahuje v ceste medzeru alebo diakritikumi to nefunguje vôbec, zaberie buď skopírovať súbor na nejaké miesto  a prípadne premenovať, alebo upraviť bat súbor:
chcp 1250
@echo off
d:\xdoc2txt\xdoc2txt.exe -n -f %1%
Riadok chcp 1250 nastavý kódovú stránku na windows 1250, docielim tým to, že program správne pochopí aj cestu D:\ondrej\knižnica\...
Problém s medzerami somv yriešil odstránením úvodzoviek teda "%1%" som zmenil na %1% (čisto pokusne, v skútočnosti neviem vysvetliť, prečo.)

ondrej_rosik

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 447
    • Zobrazit profil
    • blog
Re:Konvertovanie chranenych pdf na txt
« Odpověď #2 kdy: 19. Září 2013, 15:20:38 »
Hmm, zabudol som sem dať ešte jednu info, ak by ste chceli, aby to bolo úplne portable tak sa dá cesta v bat súbore upraviť tak, že si windows sám zistí cestu exe súboru a nemusíte ju pri presune na kľúč meniť:
@echo off
chcp 1250
%~dp0\xdoc2txt.exe -n -f %1%
reťazec %~dp0\ hovorí windowsu, pozri si cestu bat súboru a tam hľadaj aj exe súbor.

olesoft

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 14
    • Zobrazit profil
Re:Konvertovanie chranenych pdf na txt
« Odpověď #3 kdy: 14. Leden 2015, 17:17:54 »
Zdravím!
Nedal by sa ten bat súbor upraviť aj na prevod viacerých súborov zo schránky?
Napríklad ak nakopírujem trebárs 10 či viac pdf súborov do schránky, lebo takto to prevádza iba po jednom súbore.

ondrej_rosik

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 447
    • Zobrazit profil
    • blog
Re:Konvertovanie chranenych pdf na txt
« Odpověď #4 kdy: 15. Leden 2015, 13:28:20 »
Zatial som zistil len tolko, ze ak zmenis cislo medzi %% tak sa vies dostat k inemu suboru v schranke. Kazdy ma teda svoje cislo. Cize potrebujeme nieco, co bude menit cislo v premennej a po kazdom spusteni aplikacie pripocita +1. Trochu som studoval ako funguje prikaz loop, ale zial nemam teraz cas to dotiahnut do konca, navyse nechapem, ako to prepojit so schrankou. To uz by som si skor urobil nieco v autohotkey, na toto tam urcite je aj v helpe konkretny priklad.

peter

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 339
    • Zobrazit profil
Re:Konvertovanie chranenych pdf na txt
« Odpověď #5 kdy: 15. Leden 2015, 13:33:56 »
Mozes pouzit aj appchooser ak pouzivas shortcuts. V helpe je priklad.
Peter Lecký, Stopka n.o.