Česká placka

Výzkumy památek. Památková péče. Architektura.

Internetová nepaměť

Občas se Vám to asi také stalo. Našli jste někde na internetu, v mailu, ale třeba i v tiskovině v zajímavé souvislosti odkaz na on-line zdroj, kde buďto měly být podklady pro nějaké tvrzení, nebo se tam měly dát najít nějaké rozšiřující informace. Adresa vypadala věrohodně (nějaké velké periodikum, veřejnoprávní médium, vědecké pracoviště…). Asi jste už zažili to zklamání z reportu „404“ – stránka zanikla, byla přejmenována, přesunuta…

Některé stránky asi většinou uživatelů považované za efemérní, nespolehlivé, závislé na libovůli akcionářů, na svévoli podnikatele sledujícího jen výnos z kontextové reklamy atd. mohou ale překvapit stabilitou betonovou či žulovou – to je třeba případ Facebooku, kde zřejmě všechny miliardy adres stále fungují! (Samozřejmě je nějaké procento výjimek, ale to bývají stránky odstraněné pro nějaký nestravitelný obsah – rasistický, politicky nekorektní apod.). (K tomu aktuálně Klaus Graf: Archivalia heute vor zehn Jahren (archivalia.hypotheses.org; 20171007): „Z 53 odkazů sdílených na blogu Archivalia ve dnech 1.-6.10.2017 je dosud funkčních 34, 19 již je nedostupných, mezi nimi i jedna adresa Zemského archivu Bádenska-Württemberska.“)

Ale absolutní spoleh možný není. Co tedy např. s „časovými“ informacemi o památkách? Ze zpravodajských, muzejních, archivních, památkových aj. webů je většinou nemůžeme kopírovat vzhledem k licenčním omezením (autor či vydavatel někde dole píše, že si to nepřeje). Za vzor dnes můžeme dát NPÚ, který před pár týdny na web umístil licenční výminku, která nově umožňuje užít z webu texty i obrazy za podmínky svobodné licence CC (‚Není-li výslovně uvedeno jinak, podléhají fotografie a texty licenci Creative Commons (CC BY-NC-ND 3.0 CZ) (Uveďte autora | Neužívejte dílo komerčně | Nezasahujte do díla). Při užití obsahu uvádějte odkaz na stránky www.npu.cz a „zdroj: Národní památkový ústav“‘). V této souvislosti je asi zatím problém jen to, že na webu obvykle není jméno autora uváděno, takže kde je vzít, když je podmínkou licence, dále pak to, že obrázky či pasáže textu jsou přebírány z Integrovaného informačního systému památkové péče (IISPP), tedy zejména z jeho segmentů Metainformační systém (MIS) a Památkový katalog (PK), kde ovšem je uvedena „přísná“ licence ©, ovšem s nejednotným časovým údajem (2017; 2007-2017; 2015). V MIS je zpravidla jméno autora možné ověřit, i když není úplně na ráně, v PK není autorství uvedeno (ale lze to zřejmě brát tak, že se jedná o dílo pověřeného zaměstnance či týmu zaměstnanců, tedy tzv. zaměstnanecké dílo). Lze se ovšem dopátrat, že některé podrobné popisné texty byly vypracovány specializovanými experty v rámci projektů vědy a výzkumu. (Můžeme se ale dohadovat, že se i zde bude s licencemi něco dít, protože dokumenty jsou sdíleny v projektu europeana.eu, kde je ovšem jejich zpřístupnění dosud limitováno na drobný náhled se základními metadaty a s vodoznakem, o jehož odstranění či úpravě údajně probíhají jednání.)

Ale to jsem notně odbočil. Lze si představit nějaký systém záchrany paměťových dat v době, kdy ústřední instituce o to zájem nemají (nelze to vymezovat rezortně, protože se to týká archivů, knihoven, muzeí, památkářů…). Kdysi jsem ověřoval podle mého udržitelné řešení. Myšlenkově jsem jaksi navázal na výstřižkové služby z novin, které v Praze obstarávala Pražská informační služba pro mnoho institucí i soukromníků, jakož i na práci s výstřižky z novin běžnou v řadě institucí. Obvykle knihovníci ráno prošli noviny (Ruďasa, Lidovky, Práci…) a články týkající se instituce vystříhali, dali do obálky a donesli na sekretariát, takže vedení bylo obeznámeno s možnými útoky, kritikami, pochvalami… Čili jsem v „nové“ době vybíral z dotyčných zpráv pouhé texty a ukládal je do souboru *.txt, samozřejmě s uvedením názvu článku, jména autora, internetové adresy, datem vydání. Soubor jsem periodicky předával odborné knihovně s dotazem, jestli by takto nebylo možné nejen nahradit výstřižkovou službu, ale vlastně začít pořádat oborový archiv „novinových“ informací. Jak jsem uvedl, lze ověřit, že mnohé internetové zdroje o památkách hynou, kdykoliv, bez varování (typu: Oznamujeme PT příznivcům naší stránky, že část obsahu smažeme, tak si jej uložte pro vlastní potřebu /nezveřejňujte bez svolení/, pokud myslíte, že Vás zajímá; případně náš obsah předáváme na archive.org či webarchiv Národní knihovny, nebo jej archivujeme jinde a nabízíme Vám aspoň prozatím a bez záruky přesměrovací adresu, jako např. ICOMOS). Podle mého by specializovaná odborná knihovna mohla z hlediska autorského, archivního i knihovního zákona tyto zásobní údaje (a časem dost možná úplně jedinečné) hromadit na svých interních discích, chráněných před neoprávněným přístupem z internetu. Co by totiž bylo absolutně klíčové a nenahraditelné, nezastupitelné např. pokustónstvím zpravodajských webů s různými kategorizacemi zpráv, nezastupitelné ani archivováním webů Národní knihovnou, byť tomu velmi fandím, je jaksi metadatová práce. V prvním kroku fulltextové vyhledávání. V dalším zatřiďování Mezinárodního desetinného třídění (MDT), jehož funkce jsou skoro neuhlídatelným tempem vylepšovány. Důležité je to i ve spojení s NK, protože je zásadně potřebné, aby specializované knihovny obsah třídily, kategorizovaly, tagovaly, metadatovaly… Zde je hlavní úloha NK, řídit ty kategorie, „autority„, atd. tak, aby propojovaly různé typy dat, aby se mohla propojit data ze sto let starého projektu nějakého cukrovaru s nynějšími otázkami památkové ochrany jeho reliktů, aby se specializované či regionální knihovny, rovněž nabité specializovanými daty, jen nepřekřikovaly nespojitým slovníkem. Na to asi má NK nějaký redakční tým?

Je současně velmi podstatné, že z hlediska autorského či tiskového zákona je zřejmě jedině systém (veřejných?, odborných?) knihoven příslušný k tomu, aby mohl takové dokumenty uložit a za nějak stanovených podmínek (asi vč. úplaty) zpřístupňovat ke studiu. Související knihovědné knihovnické zpracování je také nejlepší zárukou toho, že tato archivovaná forma publikací bude nějak k nalezení z nejrůznějších hledisek, včetně těch, která nás (většinou) v aktuální historické situaci nenapadnou (naproti tomu třídění či názvosloví v různých databázových systémech nejsou obvykle schopné žádné operativní reakce na nové potřeby, během vývoje bývají dokonce se ztrátami obsahu upgradovány na nějaké pokročilejší IS apod.).

Mnohým z pár možných čtenářů této skici se bude zdát takové apelování zbytečné, protože si přece může uložit každý zájemce, co a jak chce. To je samozřejmě pravda. Jenže to si jednak budou „pro strýčka“ ukládat obsah do jisté míry zbytečně další a další, ačkoliv by ve skutečnosti mohli využít utříděné fondy knihoven, navíc snad pravděpodobně trvanlivější i lépe prohledatelné, než vlastní disky. Nemluvě o tom, že archivy internetových zdrojů jinak nedávají vůbec žádné záruky udržitelnosti informací a po delší době skutečně nastává velký úbytek dostupnosti.

Vídáme sice články o pozoruhodných „kronikách“ webů na archive.org, např. v archivovaných verzích lze dosud dohledat leccos, včetně pradávných koncepcí, směrnic či výročních zpráv památkového ústavu. Ale pátrat ve starších webech někdejších samostatných poboček, to už je tvrdší oříšek, ale také lze leccos dohledat. Kdyby ovšem i jejich obsah byl dostupný v knihovních fondech v nějaké kapacitně nenáročné podobě (bez grafického balastu apod.), bylo by možné jej zpřístupňovat vlastně trvale (mj. předpokládejme i vyrobení tištěné, „trezorové“ verze). Webarchiv NK sice periodicky „sklízí“ celý českých internet, ale ve veřejně přístupné části zatím podporuje uživatele vždy jen několika klíčovými slovy a zatím nerozvíjí podrobnější zpracování obsahu (rejstříky obsahu podstránek apod. – ale to je právě to, co by bylo možné vlastně jen v podobě „stabilních“ kopií vybraných verzí stránek, sice možná neobsahujících aktualizace, ale ušetřených rizika redukcí či smazání; nicméně bez rozlišení obsahu verzí nebude ani s pomocí takových nástrojů efektivní práce s obsahem).

Reklamy

2017/10/09 - Posted by | archivace, dostupnost dat, koordinace dat, standardy, udržitelnost dat |

1 komentář »

  1. […] 02. K tomu nedávno na ČP také zde. […]

    Pingback od Paměťové instituce v klidu zapomínají?… « Česká placka | 2018/01/17 | Odpovědět


Zanechat Odpověď

Vyplňte detaily níže nebo klikněte na ikonu pro přihlášení:

WordPress.com Logo

Komentujete pomocí vašeho WordPress.com účtu. Odhlásit / Změnit )

Twitter picture

Komentujete pomocí vašeho Twitter účtu. Odhlásit / Změnit )

Facebook photo

Komentujete pomocí vašeho Facebook účtu. Odhlásit / Změnit )

Google+ photo

Komentujete pomocí vašeho Google+ účtu. Odhlásit / Změnit )

Připojování k %s

Urban Jewish Heritage | Presence and Absence

3 - 7 September 2018 | Krakow, Poland

Library Policy and Advocacy Blog

Výzkumy památek. Památková péče. Architektura.

wanjawedekind

Výzkumy památek. Památková péče. Architektura.

Wikimédia France

Výzkumy památek. Památková péče. Architektura.

Caminando por la historia

Un viaje por la historia

the Wikimedia UK blog!

Výzkumy památek. Památková péče. Architektura.

Medieval Imago

Výzkumy památek. Památková péče. Architektura.

Thomas Ash

Adventures in Library and Information Science

Before Chartres

Appunti sull'arte romanica e sul tempo romanico

Medieval Histories

Výzkumy památek. Památková péče. Architektura.

Ghost Signs

Výzkumy památek. Památková péče. Architektura.

GroovyHistorian

A Groovy Historical World

Czy leci z nami archeolog

Výzkumy památek. Památková péče. Architektura.

Zamki na nowo

Blog poświęcony odbudowie historycznych zamków w Polsce

Research Center Sanssouci

Výzkumy památek. Památková péče. Architektura.

ďobo-CADzone, true men don't kill coyotes and use AutoCAD...

Výzkumy památek. Památková péče. Architektura.

Výzkumy památek. Památková péče. Architektura.

Tomáš Stěhule

Výzkumy památek. Památková péče. Architektura.