Diskuse s uživatelem:JAn Dudík/Indexy

Postup aktualizace editovat

  1. v adresáři robota /logs smazat listpages-bot.log
  2. pwb.py listpages -family:commons -lang:commons -catr:"Czech text by file" (zahrnuje hlavně kategorie c:Category:PDF files in Czech a c:Category:DjVu files in Czech)
  3. v PSPadu otevřít listpages-bot.log
  4. sloupcový blok, smazat vše až po začátek názvů souborů
  5. srovnat dle abecedy, smazat duplicity
  6. ctrl+H, nahradit s regulárním výrazem ^([a-zA-Z žŽšŠčČřŘďťňáéíóúůýěüö0-9-,\.–—\(\)\!])*\.png$ za prázdný řetězec
  7. opakovat s různými koncovkami (jpg, gif, tif, png, jpeg, svg...)
  8. vyhledat tyto koncovky ještě bez regexu (jpg, gif, tif, png, jpeg, svg...)
  9. pak promazat zbytek až zbydou jen djvu a pdf
  10. alt+I na začátek # [[Index:, na konec ]]
  11. zkopírovat k tomu toto stránku, opět smazat duplicity
  12. zkopírovat na tuto stránku
Vrátit se na uživatelskou stránku uživatele „JAn Dudík/Indexy“.