Autor Téma: ako na pdf s privela zariadkovaniami  (Přečteno 2473 krát)

peter

  • Reset Staff
  • Newbie
  • *
  • Příspěvků: 345
    • Zobrazit profil
ako na pdf s privela zariadkovaniami
« kdy: 6. Červen 2011, 13:01:28 »
Tento text by mohol pomoct tym z vas, co si obcas zvyknete ukladat pdf v acrobat readery do txt (file/save as text). Cas od casu sa stretavam s narekmi nesucimi posolstvo, ze takto vyrobene txt je pomerne tazko citatelne, pretoze ma pokazenu diakritiku, alebo je kazde slovo na samostatnom riadku. Problem s diakritikou vo vseobecnosti nemozno uspesne vyriesit, zariadkovani za kazdym slovom sa vsak zbavit da.
Pomocou nasledujuceho navodu mozno v txt subore vymazat vsetky zariadkovania pred ktorimi je medzera. Predpokladame teda, ze medzery na koniec riadku nikto nedava a vznikaju tam len vlozenim zariadkovani pri konverzii do txt. Treba vsak povedat, ze tento predpoklad je trochu odvazny, pretoze narazit na dokument ktory ma medzery na konci riadkov nieje nic vynimocne. Teda moze sa stat, ze pomocou nizsie uvedeneho navodu pomazete aj zariadkovania ktore v dokumente byt maju.

Ako vzorovy dokument v navode pouzijeme skripta o lavinach urcene pre horskych zachranarov. Najdete ich tu:
http://www.climbingschool.cz/var/uploads/files/000000/000044/laviny_skripta_CHS.pdf
Po konverte na txt (otvorit v acrobat readery a ulozit ako text) dostaneme klasicky nepodarok so zariadkovanim za kazdym slovom.
1. Txt subor otvorte vo worde
2. vyvolajte dialog hladat a nahradit (ctrl+h - plati pre word 2003 aj 2010)
3. Aktivujte tlacidlo "viac" "more" "podrobnosti" alebo cosi podobne. Pouzivatelov slovenskeho jawsu bude pravdepodobne zaujimat informacia, ze slovensky jaws toto tlacidlo v niektorych verziach cita ako "posun dolu" alebo nieco podobne. Nedajte sa teda zmiast.
4. Zaciarknite policko "pouzit zastupne znaky" ("use wildcards")
5. Do policka hladat napiste " ^13" bez uvodzoviek, ale vratane medzery ktora v uvodzovkach je. Znaky ^13 hovoria, ze hladame zariadkovanie a medzera pred nimi hovori, ze chceme najst len take zariadkovania, pred ktorymi je medzera.
6. Do policka nahradit napiste medzeru (zariadkovanie predradene medzerou chceme nahradit medzerou, aby nam z riadkov nevzniklo jedno dlhe slovo)
7. Stlacte tlacidlo "nahradit vsetko" ("replace all"). Operacia nahradzania moze vdaka nie prave casovo optimalnej implementacii algoritmu pre nahradzanie vo worde trvat niekolko (desiatok) sekund. Trpezlivo teda vyckajte na dialog wordu, ktory oznamuje kolko nahrad bolo vykonanych. V skriptach na ktorych si trik skusate trvalo nahradzanie u mna cca 5 sekund.
8. Zatvorte dialog hladat a nahradit a mozete sa pustit do citania.
Peter Lecký, Stopka n.o.