Koncepty seznamů hesel Otty

editovat
Díly Ottova slovníku naučného
Díl Rozsah Rok vydání Archive.org
1. A – Alpy 1888 Archive.org
2. Alqueire – Ažušak 1889 Archive.org
3. B – Bianchi 1890 Archive.org
4. Bianchi-Gioviny – Bžunda 1891 Archive.org
5. C – Čechůvky 1892 Archive.org
6. Čechy – Danseur 1893 Archive.org
7. Dánsko – Dřevec 1893 Archive.org
8. Dřevěné stavby – Falšování 1894 Archive.org
9. Falšování potravin a pochutin – Genrista 1895 Archive.org
10. Gens – Hedwigia 1896 Archive.org
11. Hédypathie – Hýždě 1897 Archive.org
12. Ch – Sv. Jan 1897 Archive.org
13. Jana – Kartas 1898 Archive.org
14. Kartel – Kraj 1899 Archive.org
15. Krajčij – Ligustrum 1900 Archive.org
16. Líh – Media 1900 Archive.org
17. Median – Navarrete 1901 Archive.org
18. Navary – Oživnutí 1902 Archive.org
19. P – Pohoř 1902 Archive.org
20. Pohora – Q. v. 1903 Archive.org
21. R (Ř) – Rozkoš 1904 Archive.org
22. Rozkošný – Schloppe 1904 Archive.org
23. Schlossar – Starowolski 1905 Archive.org
24. Staroženské – Šyl 1906 Archive.org
25. T – Tzschirner 1906 Archive.org
26. U – Vusín 1907 Archive.org
27. Vůz – Źyźkowski 1908 Archive.org
28. Doplňky 1909

RegEx OSN

editovat
  1. Find&Replace tučná, Cut&Paste do nového dokumentu
  2. http://www.regexr.com/
  3. nahradit (\w|,|, |\)|d' |[ěščřžýáíéůúňďťóć]| |\.)(zač.písmeno_dle_dílu) za $1\n$2
    1. některé díly obsahují hesla od více začátečních písmen, provést proceduru pro všechna!!!
  4. nahradit dvojtečku s mezerou za mezeru
  5. nahradit :zač.písmeno_dle_dílu za \nzač.písmeno_dle_dílu
  6. nahradit ,\n|, \n| \n za \n
  7. ručně ošetřit van, von, de, z, ze atd.
  8. odstranit duplicitní řádky pomocí textmechanic.com
  9. uveřejnit ve formě sloupce hesel na samostaných řádcích ke společné korektuře
  10. nahradit (.+)\n za [[Ottův slovník naučný/$1|$1]] —

Rozepsaný krok 3 a krok 10

  1. (\w)(zač.písmeno_dle_dílu) za $1\n$2 = odřádkování dle poč. písmen za ascii znaky, při potřebě opakovat
  2. (,)(zač.písmeno_dle_dílu) za $1\n$2 = odřádkování dle čárek
  3. (, )(zač.písmeno_dle_dílu) za $1\n$2 = odřádkování dle čárek s mezerou
  4. (\))(zač.písmeno_dle_dílu) za $1\n$2 = odřádkování dle závorek
  5. (d' ) za \nd' = odřádkování dle "d' "
  6. ([ěščřžýáíéůúňďťó])(zač.písmeno_dle_dílu) za $1\n$2 = odřádkování dle poč. písmen za znaky s diaktritikou
  1. opatřit prefixem [[Ottův slovník naučný/ a opatřit sufixem |název_hesla]] — pomocí (.+)\n za [[Ottův slovník naučný/$1|$1]] —