Nápověda:Korektury

Digitalizace

editovat

Většina textů, které Wikizdroje poskytují, byla původně vydána v tištěné podobě. Aby je čtenáři mohli obdržet v elektronické podobě, musí být texty převedeny, digitalizovány. Nejjednodušší, leč nejpracnější způsob digitalizace je vzít si tištěnou předlohu, sednout si k počítači a pomocí klávesnice do něj příslušný text pozorně přepsat. V některých případech nám nic jiného opravdu nezbývá. Ve většině případů si však lze vypomoci. snadnějšími postupy.

Proces digitalizace má obvykle několik základních fází:

  1. Naskenování nebo digitální nafocení tištěného originálu do obrazového souboru (formáty tiff, jpg, djvu apod.)
  2. Automatizované optické rozpoznání textu (OCR) v obrazovém souboru, které text »přečte« a převede do znakové podoby.
  3. Žádný stroj není dokonalý, takže po automatizovaném OCR musí přijít člověk, který celý text pročte a opraví v něm chyby, kterých se počítač při rozpoznávání znaků dopustil.
  4. Při té příležitosti je možné text zformátovat příslušnými nástroji pro sazbu (v našem případě doplnit odpovídající značky wikisyntaxe).
  5. Ani člověk není dokonalý a opakované zpracovávání téhož textu snižuje pozornost, takže po všech opravách a úpravách je žádoucí, aby jiný člověk celý výsledek ještě jednou překontroloval. (Chceme-li opravdu dokonalý výsledek, lze tuto fázi i několikrát opakovat.)

Fáze 3–5 označujeme obvykle jako korekturu (anglicky proofreading). Lidský vklad je pro tyto fáze sice nenahraditelný, Wikizdroje ale poskytují nástroje, které mohou v řadě případů práci korektorů usnadnit a pomoci lépe zorganizovat:

  • Jmenný prostor Index: umožňuje propojení opravovaného textu s příslušnými naskenovanými obrázkovými soubory umístěnými na Commons. Obrázky se pak korektorům při opravách zobrazují vedle zpracovávaného textu.
  • Jmenný prostor Stránka: obsahuje jednotlivé stránky korigovaného textu. Naskenované originály se korektorovi zobrazují vedle nebo nad zpracovávanou částí textu. Stránky v tomto jmenném prostoru jsou vybaveny nástroji pro snadnější navigaci. U každé jednotlivé stránky lze také evidovat, v jaké fázi digitalizačního procesu (OCR, oprava, kontrola) se nachází. Tyto údaje jsou pak přehledně zobrazovány i v indexu a případně i na stránce příslušného díla.
  • Texty z jmenného prostoru Stránka: lze do hlavního jmenného prostoru transkludovat. Texty od určité míry zpracovanosti (např. opravené, ale ještě ne všechny části zkontrolované) lze tedy již zveřejnit, ale přitom finální práce na korekturách mohou dál pokračovat.

Aby nástroje korektorům co nejlépe sloužili, je třeba při přípravě textu dodržet některé zásady.

Autorská práva

editovat

Než začnete, ujistěte se, že na díle neváznou majetková práva autorů nebo jejich právních nástupců. Zejména pozor na to, že projekt Wikimedia Commons může v konkrétním případě uplatňovat přísnější licenční politiku než české Wikizdroje

Máte-li například naskenovanou kopii knihy obsahující kromě vlastního textu i ilustrace, fotografie, notové a jiné přílohy, předmluvu nebo doslov od jiného autora apod., je pro umístění takové kopie na Commons třeba, aby byly licencí pokryty všechny složky díla, i když z něj hodláme pro korektury na Wikizdrojích použít pouze licencovanou část. Problematická kopie by mohla být z Commons smazána a veškerá práce s propojováním textů s naskenovanými originály by přišla vniveč.

Řešením může umístění pouze stran s licencovaným (volným) obsahem, popřípadě začernění či rozmazání autorsky chráněných částí. Je-li naskenované dílo umístěno na jiném serveru se stabilní URL, lze v případě potřeby propojit korigované texty i s takovými obrázky.

Skenování textů

editovat

(Podrobnější instrukce na stránce Nápověda:Skenování textů a Wikizdroje:Zdroje naskenovaných textů)

Než se pustíte do práce, důkladně se podívejte, zda kniha náhodou již na Wikimedia Commons není uložena. Při tom může být užitečný Seznam skenů k převodu a korektuře na Commons, který ale nemusí být úplný a aktuální.

Pokud není, můžete se pokusit najít naskenovanou knihu na veřejně přístupných webech různých institucí, zejména knihoven, univerzit apod. I zde lze využít Wikizdroje:Seznam skenů k převodu a korektuře z vnějších zdrojů; vzhledem k tomu, že vnějších zdrojů je značné množství, má ovšem tento seznam spíše jen inspirativní charakter.

U knih nalezených v externích zdrojích je třeba pamatovat, že jejich zpřístupnění tam neznamená automaticky, že jsou autorskoprávně volné a použitelné pro commons.

Skenujete-li texty sami, nastavte dostatečně vysoké rozlišení. Bude-li se s naskenovaným obrázkem provádět OCR, lze doporučit minimálně 200 dpi, lépe 300 dpi. Z formátů nástroje Wikizdrojů podporují jpg, gif, a png. Lze také použít vícestránkové formáty pdf a djvu; jejich použití vám usnadní zejména upload na commons a vytváření indexové stránky.

Umístění textů na Commons

editovat

Máte-li připravený naskenovaný text, je třeba jej umístit na projekt Wikimedia Commons.

Nejprve zvolte pro soubor vhodný název. Technicky je sice možné pojmenovat soubor jménem ve stylu XpV36_.pdf, není to však příliš ohleduplné vůči dalším uživatelům. Pamatujte, že tímto názvem budou následně označovány i stránky na Wikizdrojích, kde budou prováděny korektury. Kombinace jména autora a názvu knihy, doplněná podle potřeby o číslo, rok nebo místo vydání, je obvykle vhodná volba. Podívejte se, jak je zvykem pojmenovávat soubory s podobnými knihami, které už na Commons jsou, a držte se tamních zvyklostí.

Pro upload souboru (souborů) lze použít nástroj Special:UploadWizard, nebo standardní uploadovací stránku. Pro náročnější uživatele existují i sofistikovanější nástroje, které se mohou hodit např. pro nahrávání většího množství stránek naskenovaných do samostatných souborů.

Poznámka: Chcete-li na Commons umístit knihu, která je k dispozici v Internetovém archivu, je možné využít nástroj IA-upload. Pro Google Books a některé další archívy může podobnou službu poskytnout Book Uploader Bot.

Kromě samotného uploadu souboru (souborů) je potřeba doplnit informace do popisného souboru. Special:UploadWizard vás tímto procesem snadno provede a vytvoří správně zformátovaný popisný soubor za vás. Popisnou stránku je možné následně doplňovat a upravovat, není tedy třeba mít obavu, že nebude perfektní hned napoprvé.

Korektura pomocí extenze Proofread

editovat

Viz Nápověda:Příprava textů ke korektuře.