Uživatel:Reaperman/Úvahy/Kategorizace

Za jeden ze základních problémů Wikizdrojů považuji skutečnost, že neumí čtenářům prodat svůj obsah, kterého již přeci jen není úplně málo.

Na prvním místě je třeba si položit otázku „a dokáží vůbec čtenáři obsah na Wikizdrojích najít?“ Zcela jistě ano, ale pouze za předpokladu, že hledají konkrétní text přímo tady pomocí vyhledávacího pole, nebo hledají dílo konkrétního autora. Google s Wikizdroji příliš nekamarádí, takže s pomocí jeho vyhledávání je spíše náhoda, když se sem někdo dostane (pozn.: otázku, zda má čtenář důvod se vrátit si nechme na jindy).

No ale co když máme člověka, který hledá, ale neví co konkrétně? Dobrý prodavač nebo knihovník takovému člověku poradí, nabídne, nasměruje ho. Na Wikizdrojích ale takový nešťastník narazí.

Východisko editovat

 
Současný stav kategorizace děl…

Prakticky by tuto otázku měly řešit kategorie, ale neřeší. Při pohledu do základní kategorie děl, kam nás směřuje hlavní strana, najdeme pět kategorií, z nichž pouze Kategorie:Díla podle formy vypadá, že bychom při brouzdání mohli narazit na něco zajímavého. Ale ejhle. Díla tu nejsou jen podle formy, ale také podle literárních žánrů (různě přes sebe nestrukturovaně naházených), podle toho, zda jde o sbírku, atd. Při bližším hledání najdeme ještě kategorii Umělecká literatura jako jednu z podvětví obsahově problematické Kategorie:Téma, která je opět členěna do několika literárních žánrů.

A při bližším pohledu zjistíme, že v tom ani zdaleka nejsou zahrnuta všechna díla, která můžeme nabídnout. Proč tomu tak je, je nasnadě. Za prvé je to celé nepřehledné a za druhé třídění literárních děl rozhodně není triviální a přímočará záležitost, takže spousta děl zůstane mimo tyto kategorie.

Jak z toho ven? Zpátky na stromy a přepracovat! Nový systém by měl být jednoduchý a každému srozumitelný, umožňující třídění a vyhledávání podle různých hledisek, zařazení jednoznačné a nesporné.

Současný systém kategorizace vychází z principů, které nastavila Wikipedie (jelikož většina editorů sesterských projektů se na ně dostává právě přes Wikipedii a ti si přináší tamní zvyklosti), ale Wikizdroje nejsou encyklopedie, ale podle vlastních slov „svobodná knihovna děl“, tak proč se od toho neodpíchnout.

Ve srovnání s běžnými knihovnami patří Wikizdroje svým rozsahem mezi ty menší. Tak si takovou menší městskou knihovnu představme.

Vstoupíme do ní a vidíme několik řad regálů s vyskládanými knihami, mezi kterými můžeme volně procházet, objevovat nové knihy a listovat jimi. Pokud potřebujeme něco konkrétního máme k dispozici katalog, dříve v podobě lístkového katalogu, dnes většinou ve formě počítačové databáze.

Tím se nám základní kategorie děl rozpadá na dva stromy. Ten první odpovídá volnému výběru. Ten druhý, který pro odlišení budu nazývat katalogizace, odpovídá katalogu umožňujícímu vyhledávání podle různých literárněvědných a bibliografických hledisek.

Kategorizace je ta, která musí zůstat co možná nejjednodušší a nejkompletnější, zatímco katalogizace bude již z principu podstatně komplexnější záležitost. A právě kvůli složitosti katalogizace bych tuto otázku nechal na nějakou jinou příležitost a ve zbytku textu se věnoval jen kategorizaci jako ekvivalentu volného výběru.

Kategorizace editovat

 
Kam bychom mohli směřovat…

Ani v rámci volného výběru nejsou knihy na jedné hromadě, ale dále se třídí. V menších knihovnách je běžné rozdělení na část pro dospělé a na část pro děti a mládež. To pro Wikizdroje nepovažuji za vhodné hned z několika důvodů:

  1. výběr knih pro děti a mládež (a popřípadě další členění podle věku čtenáře) není vůbec záležitost, kterou by mohl provádět každý (= není to jednoduché);
  2. stanovení, co je literatura pro mládež a co pro dospělé se v průběhu času mění (= není to jednoznačné);
  3. zde přítomné knihy jsou velmi staré, pro děti často jazykově těžko srozumitelné;
  4. ne všechny pro děti vhodné texty jsou tu zpracovány způsobem, který by byl pro děti zajímavý;

a proto bych toto rozdělení nechal katalogizaci.

Jakým jiným způsobem se knihy třídí? Co třeba na beletrii a odbornou literaturu? To by mohla být cesta. Rozdělme si náš pomyslný volný výběr do jednotlivých oddělení, například:

  • Krásná literatura
  • Naučná literatura
  • Periodika

Podle potřeby můžeme zřídit i další oddělení:

  • Hudebniny (primární je zápis hudební složky díla)
  • Právní předpisy (zákony, mezinárodní smlouvy, atp.)
  • Šedá literatura
  • atp.

Základem pro každé oddělení by mělo být, že k němu budeme mít nějaké minimální množství textů, a že tyto texty vyžadují odlišný přístup od ostatních oddělení.

Krásná literatura editovat

Krásnou literaturu lze členit dle celé řady hledisek. Nejjednodušším dělením pro laika se zdá být rozdělení na prózu, poezii a drama. Každá kniha právě v jedné z těchto „sekcí“. A to je vše. Členění podle literárních druhů, žánrů, variant a jiných hledisek ponechme katalogizaci.

I takové jednoduché rozdělení určitě zanechává některé otevřené otázky.

Například co když kniha sestává z více textů v různých formách? V takovém případě by měla být zařazena podle toho, která forma je pro knihu hlavní. Například Román o věrném přátelství Amise a Amila obsahuje části psané ve verších a jedna kapitola je dokonce z větší části dramatem, hlavně jde ale o prozaické dílo a tedy by mělo být v kategorii próza.

V některých případech ale může být určení hlavní formy složitější, například u almanachu Máj není snadné stanovit zda je hlavní básnická nebo prozaická část. Taková díla ponechme zatím nezatříděná, jen v kategorii Krásná literatura.

Naučná literatura editovat

Naučná literatura je tvrdší oříšek. Běžně se třídí podle oborů. V knihovnách užívané desetinné třídění není úplně intuitivní a kompatibilní s kategorizací v MediaWiki, navíc vyžaduje hlubší znalosti tohoto systému. Třídění Kongresové knihovny, které používají například na anglických Wikizdrojích, si s MediaWiki rozumí lépe, pro laika je intuitivnější než desetinné třídění, ale přece jen jedná se o systém postavených na základě amerických reálií.

Po delším hledání jsem narazil na Polytematický strukturovaný heslář (PSH), který se zdá po určitých přizpůsobeních takřka ideálním. Je založen na intuitivní struktuře, je vytvořen na základě českých reálií (Národní technická knihovna), má kompatibilní licenci (CC BY SA 3.0 CZ).

V případě, že bychom PSH přijali, určitě není žádoucí převzít ho v celém rozsahu. Naučné literatury tu zase tolik nemáme a čtenáře bychom hodili do labyrintu prázdných či poloprázdných kategorií. V první fázi bychom přebírali pouze základní úrovně (pokud bychom pro ně měli nějaký obsah), a až teprve v případě, že bychom měli dostatek knih pro podkategorii (řádově desítky), tak bychom tuto převzali. Zároveň bychom neměli jít ve struktuře příliš hluboko (řádově tak maximálně do třetí úrovně).

Kniha by opět byla zařazena pouze na jednom místě kategorizačního stromu. Hlubší členění, klíčová slova, rozdělení na populárně naučnou a odbornou literaturu by se řešilo v katalogizaci.

Periodika editovat

Problematika periodik je na českých Wikizdrojích doposud značně neprobádaná a neustálená. V prvé fázi se proto jako nejschůdnější postup jeví roztřídit je do „krabic“ pouze podle titulu, kdy v kategorii by poté byla hlavní stránka periodika a přehledy (obsahy) jednotlivých čísel. Později by se podle potřeby mohly jednotlivé tituly například podřadit do kategorií podle zaměření periodika, nebo zvolit jiné příhodné kritérium, které vyplyne z praxe.

Srovnání principů kategorizace a katalogizace editovat

Nastíněný systém kategorizace se v některých ohledech i dost zásadně liší od zažitých postupů, je tedy na místě shrnout některé odlišnosti, na kterých staví, a které jsou zásadní pro jeho fungování.

Kategorizace Katalogizace
Pouze kořenové stránky. Jedná se o ekvivalent fyzického stavění knižních svazků v knihovně. Kořenové stránky i podstránky. V rámci katalogu lze značkovat a vyhledávat i jednotlivé funkčně samostatné části knihy nebo periodika.
Každá knihovní jednotka se nachází právě na jednom místě v kategorizačním stromu. Opět se jedná o ekvivalent fyzického stavění knih v knihovnách, kdy lze jen těžko jednu knihu umístit na více míst (a samozřejmě by se neměla ani nikam ztratit). Každý text může mít dle potřeby vícero značek z katalogu. A to jak v rámci jednoho i více hledisek.
Struktura kategorizačního stromu je předem daná a v zásadě konečná. Do katalogu lze dle potřeby přidávat další hlediska a úrovně.
Prováděna lokálně. Lze provádět i automatizovaně podle dat na Wikidatech.