Wikizdroje:U pramene: Porovnání verzí
Smazaný obsah Přidaný obsah
→Sjednocení odkazovaných scanů OSN na archive.org: dosavadní poznatky |
→Sjednocení odkazovaných scanů OSN na archive.org: aktuální stav a výhled do budoucna |
||
Řádek 262:
Tak jsem zjistil, že je v tom tady příšerný chaos. Některé díly "používají" až čtyři scany, přičemž v řadě případů to je prostá copypaste chyba, kdy někdo upravil buď název dílu nebo URL, ale už ne obojí, takže "Xtý díl" odkazuje na scany dílu ypsilontého. Kromě toho vládne nejednotnost v pojmenování ("Dvacátý druhý" vs. "Dvacátýdruhý" vs. "Dvaadvacátý", "[Dvacátý[ ]]První" vs. "[Dvacátý[ ]]Prvý") a řada překlepů (Dvanácátý, Dvacátsedmý, Osmný, Šetnáctý).<br />{{Uživatel:Danny B./podpis}} 20. 2. 2015, 18:09 (UTC)
Opravil jsem
* všechny překlepy
* většinu diskrepancí u Dvacátý[ ]xtý (zbývá "Dvacátý druhý" a "Dvacátý čtvrtý")
* všechny nesouhlasící díly versus odkazy
* většinu chybných letopočtů (zbývá "Sedmý díl ... 1898")
Zjistil jsem, že
* 9 dílů používá jeden zdroj
* 14 dílů používá dva zdroje
* 4 díly používají 3 zdroje
* zdroje pocházejí z různých scanování a z různých knihoven
* 280 hesel nemá uvedeno URL
* 1 heslo má v sobě dvě URL (byl sloučen text původního hesla a errata)
* není vždy jisté, že URL odkazuje na správnou stránku (nebylo v mých silách to ověřovat)
Většina chyb pochází z copypastování a nedostatečného upravení překopírovaného textu zdroje. Pokud bychom byli schopni stanovit, které scany se budou používat (jsou mj. různé kvality), tak by se dalo těmto chybám předejít automatizací vyplňování. A pokud by se tu kolektivně podařilo udělat i průzkum těch scanů, dokonce by se daly automatizovat i odkazy na ně, takže by byla jistota, že pokud je zadáno správně číslo dílu a číslo strany (to jsou jediné dva údaje o zdroji, které musí být zadávány ručně, vše ostatní lze udělat automaticky), tak všechny ostatní informace o zdroji jsou správné.
{{Uživatel:Danny B./podpis}} 21. 2. 2015, 06:10 (UTC)
== Přesměrování pro českou klávesnici ==
|