Smazaný obsah Přidaný obsah
Zdenek (diskuse | příspěvky)
→‎Zakládání prázdných stránek: díky za příznivou zprávu a rozsáhlejší odpověď
Řádek 96:
V každém případě hodím uvedené stránky co nejdříve "do modra".
--[[Uživatel:Zdenek|Zdenek]] 15. 12. 2009, 08:27 (UTC)
: Díky za příznivou zprávu, ale zvaž, jestli skutečně nebude lepší zakládat další sbírky až poté, co ty předchozí dokončíš. Znám to i od sebe: jednou něco přerušíš, aby sis na chvíli odpočnul třeba od těžkého jazyka nebo potřeby rozsáhlé korektury, a v mezidobí děláš na něčem méně náročném, pak se k tomu původnímu ale už těžko vracíš zpátky. Stačí se podívat do [[:Kategorie:Rozšířit]], kolik se toho za tři roky nashromáždilo. Navíc šablonou {{Šablona|Pracuje se}} říkáš ostatním, aby to nechali na pokoji, protože na tom právě intenzivně pracuješ ty, ale pokud by se delší dobu nic nedělo, jen tím bráníš někomu jinému, který by si jinak řekl: vida, nedokončené dílo, dokončím je. Třeba já jsem se na tomhle projektu ocitl (a už zůstal) právě tak, že jsem našel rozdělané [[Staré pověsti české]], ale tenkrát na té stránce byla navíc šablonka vyzývající k rozšíření.
: '''Prakticky ke krameriovi:''' na každé stránce se skenem máš dole odkaz „Soubor ke stažení“, klikni na něj, otevře se ti jen vnitřní rámec s djvu pluginem a v adresním řádku pak změň číslo, které je hodnotou parametru id, o +1. U většiny stránek, které nejsou tištěny frakturou apod., dostaneš vyextrahovaný text. Ale pozor, je nutné jej pečlivě zkorigovat řádek po řádku proti skenu, je to jen hrubé OCR, u nekvalitních skenů ze starých knih může obsahovat velmi mnoho chyb a nelze se spolehnout ani na korektor překlepů, protože může vzniknout jiné existující slovo (už jsem se s tím setkal mockrát, však i OCR software, kterým to má NK ČR projeté, evidentně používá slovník, a vznikají pak až úsměvné chyby typu „pán hulí“ místo „pán bůh“). Případně mi pošli přes [[Special:Emailuser/Milda|e-mailové rozhraní]] svou mailovou adresu a pošlu ti jako přílohu veškerý OCR text z každé sbírky (nebo cokoliv dalšího, napsal jsem na to prográmek, ale zrovna ty Vrchlického sbírky už delší dobu stažené mám) v jednom souboru, oproti kopírování stránky po stránce to je znatelné zjednodušení a zrychlení.
: '''Ke Commons:''' není na tom nic složitého, ale je pravda, že kvůli malému rozlišení a velmi vysokému stupni komprese jsou obrázky na krameriovi většinou dost nekvalitní. Tady by pomohlo si tu knihu půjčit v některé z větších knihoven, které mají i takto staré fondy (nebo pozdější vydání v rámci sebraných spisů), a z nich to naskenovat nebo kvalitně nafotit. Třeba bych to i udělal, jen co se do některé z takových knihoven dostanu. --[[Uživatel:Milda|Milda]] 15. 12. 2009, 09:36 (UTC)