Metaadatok - Metadata

A 21. században a metaadatok jellemzően a digitális űrlapokra utalnak, de a hagyományos kártya katalógusok metaadatokat tartalmaznak, a kártyák a könyvtárban található könyvekről (szerző, cím, tárgy stb.) Tartalmaznak információkat.

A metaadatok " adatok, amelyek más adatokról nyújtanak információt", de nem az adatok tartalma, például az üzenet szövege vagy maga a kép. Sok különböző típusú metaadat létezik, többek között:

  • Leíró metaadatok - az erőforrással kapcsolatos leíró információk. Felfedezésre és azonosításra használják. Olyan elemeket tartalmaz, mint a cím, az absztrakt, a szerző és a kulcsszavak.
  • Szerkezeti metaadatok - metaadatok az adattárolókról, és jelzik, hogy az összetett objektumok hogyan állnak össze, például az oldalak rendezése fejezetekké. Leírja a digitális anyagok típusait, verzióit, kapcsolatait és egyéb jellemzőit.
  • Felügyeleti metaadatok - olyan információk, amelyek segítenek az erőforrás kezelésében, például az erőforrástípus, az engedélyek, valamint az, hogy mikor és hogyan hozták létre.
  • Referencia metaadatok - a statisztikai adatok tartalmára és minőségére vonatkozó információk.
  • A statisztikai metaadatok , más néven folyamatadatok, leírhatnak olyan folyamatokat, amelyek statisztikai adatokat gyűjtenek, dolgoznak fel vagy állítanak elő.
  • Jogi metaadatok - információkat szolgáltat az alkotóról, a szerzői jogok tulajdonosáról és a nyilvános licencről, ha van ilyen.

A metaadatok nem korlátozódnak szigorúan e kategóriák egyikére, mivel sok más módon is leírhatnak egy adatot.

Történelem

A metaadatoknak különböző céljaik vannak. Segíthet a felhasználóknak megtalálni a releváns információkat és felfedezni az erőforrásokat. Segíthet az elektronikus források rendszerezésében, a digitális azonosítás biztosításában, valamint az erőforrások archiválásában és megőrzésében. A metaadatok lehetővé teszik a felhasználók számára az erőforrások elérését azáltal, hogy "lehetővé teszik az erőforrások megtalálását a releváns kritériumok alapján, azonosítják az erőforrásokat, összehozzák a hasonló erőforrásokat, megkülönböztetik az eltérő erőforrásokat és megadják a helyadatokat". A távközlési tevékenységek metaadatait, beleértve az internetes forgalmat, nagyon széles körben gyűjtik a különböző nemzeti kormányzati szervezetek. Ezeket az adatokat a forgalom elemzésére használják, és felhasználhatók tömeges megfigyelésre .

A metaadatokat hagyományosan a könyvtárak kártya katalógusaiban használták az 1980 -as évekig, amikor a könyvtárak katalógusadataikat digitális adatbázisokká alakították át. A 2000 -es években, amikor az adatokat és információkat egyre inkább digitálisan tárolták, ezeket a digitális adatokat metaadat -szabványokkal írták le .

A számítógépes rendszerekre vonatkozó "metaadatok" első leírását állítólag az MIT Nemzetközi Tanulmányok Központjának szakértői, David Griffel és Stuart McIntosh 1967 -ben jegyzik meg: "Összefoglalva tehát, tárgyi nyelven állítunk az adatok tárgyleírásairól és a token kódokról Az adatviszonyokat és transzformációkat leíró meta nyelvű kijelentéseink is vannak, és a normának és az adatoknak kell/kell lenniük. "

A különböző tudományterületekre egyedi metaadat -szabványok léteznek (pl. Múzeumi gyűjtemények, digitális hangfájlok , weboldalak stb.). Az adatok vagy adatfájlok tartalmának és kontextusának leírása növeli annak hasznosságát. Például egy weboldal tartalmazhat metaadatokat, amelyek meghatározzák, hogy az adott szoftver milyen nyelven íródott (pl. HTML), milyen eszközökkel készítették el az oldalt, milyen témákról szól az oldal, és hol találhat további információkat a témáról. Ezek a metaadatok automatikusan javíthatják az olvasó élményét, és megkönnyíthetik a felhasználók számára a weboldal online megtalálását. A CD tartalmazhat olyan metaadatokat, amelyek információt nyújtanak azokról a zenészekről, énekesekről és dalszerzőkről, akiknek munkája megjelenik a lemezen.

Sok országban a kormányzati szervezetek rendszeresen tárolják az e -mailekről, telefonhívásokról, weboldalakról, videoforgalomról, IP -kapcsolatokról és mobiltelefon -helyekről szóló metaadatokat.

Meghatározás

A metaadatok jelentése "adatok az adatokról". Bár a "meta" előtag "után" vagy "túl" -t jelent, az ismeretelméletben "körülbelül" -et jelent. A metaadatok az adatok egy vagy több aspektusára vonatkozó információt szolgáltató adatok; az adatokról szóló alapvető információk összefoglalására szolgál, amelyek megkönnyíthetik a nyomon követést és az egyes adatokkal való munkát. Néhány példa:

  • Az adatok létrehozásának eszközei
  • Az adatok célja
  • A létrehozás ideje és dátuma
  • Az adatok készítője vagy szerzője
  • Az adatok létrehozásának helye a számítógépes hálózaton
  • Használt szabványok
  • Fájl méret
  • Adat minőség
  • Az adatok forrása
  • Az adatok létrehozásához használt folyamat

Például egy digitális kép tartalmazhat metaadatokat, amelyek leírják a kép méretét, színmélységét, felbontását, létrehozásakor, a zársebességet és egyéb adatokat. A szöveges dokumentum metaadatai tartalmazhatnak információkat arról, hogy a dokumentum milyen hosszú, ki a szerző, mikor készült a dokumentum, és egy rövid összefoglalót a dokumentumról. A weboldalakon belüli metaadatok az oldal tartalmának leírását, valamint a tartalomhoz kapcsolódó kulcsszavakat is tartalmazhatnak. Ezeket a hivatkozásokat gyakran "metacímkéknek" nevezik, amelyeket az 1990 -es évek végéig elsődleges tényezőként használtak a webes keresés sorrendjének meghatározásakor. Az 1990 -es évek végén a "kulcsszótöltés" miatt csökkent a metacímkék függősége az internetes keresésekben. A metaadatokat nagyrészt rosszul használták arra, hogy a keresőmotorokat arra késztessék, hogy azt gondolják, hogy egyes webhelyek nagyobb jelentőséggel bírnak a keresésben, mint valójában.

A metaadatok tárolhatók és kezelhetők egy adatbázisban , amelyet gyakran metaadat -nyilvántartásnak vagy metaadat -lerakatnak neveznek . Kontextus és referenciapont nélkül azonban lehetetlen lehet a metaadatokat azonosítani pusztán ránézésre. Például: önmagában egy adatbázis, amely számos számot tartalmaz, mind a 13 számjegy hosszú lehet a számítások eredménye vagy az egyenletbe illeszthető számok listája - minden egyéb kontextus nélkül maguk a számok is adatnak tekinthetők. De ha figyelembe vesszük azt az összefüggést, hogy ez az adatbázis egy könyvgyűjtemény naplója, akkor ezeket a 13 számjegyű számokat most ISBN -ként lehet azonosítani - olyan információkat, amelyek a könyvre vonatkoznak, de önmagukban nem a könyvben található információk. A "metaadatok" kifejezést 1968 -ban Philip Bagley alkotta meg "Extension of Programming Language Concepts" című könyvében, ahol egyértelmű, hogy a kifejezést az ISO 11179 "hagyományos" értelemben használja, azaz "strukturális metaadatok", azaz "adatok" az adattárolókról "; nem pedig az alternatív értelemben vett „tartalom az adattartalom egyes példányairól” vagy a metacontent, hanem a könyvtári katalógusokban általában megtalálható adatok típusa. Azóta az információmenedzsment, az információs tudomány, az információtechnológia, a könyvtárak és a térinformatika területén széles körben elterjedt a kifejezés. Ezekben a mezőkben a metaadatok szó "adatok az adatokról". Bár ez az általánosan elfogadott definíció, a különböző tudományágak elfogadták a saját, konkrétabb magyarázatukat és a kifejezés használatát.

A Slate 2013 -ban arról számolt be, hogy az Egyesült Államok kormánya a "metaadatok" értelmezése széles körű lehet, és tartalmazhat üzenettartalmat, például az e -mailek tárgysorát.

Típusok

Míg a metaadat-alkalmazás sokrétű, sokféle területet lefed, vannak speciális és jól elfogadott modellek a metaadatok típusainak megadására. Bretherton & Singley (1994) két különböző osztályt különböztet meg: a strukturális/kontroll metaadatokat és az irányadó metaadatokat. A strukturális metaadatok az adatbázis -objektumok, például táblázatok, oszlopok, kulcsok és indexek szerkezetét írják le. Az útmutató metaadatok segítenek az embereknek konkrét elemek megtalálásában, és általában kulcsszókészletként fejezik ki őket természetes nyelven. Ralph Kimball szerint a metaadatok két hasonló kategóriába sorolhatók: technikai és üzleti metaadatok. A műszaki metaadatok a belső, az üzleti metaadatok a külső metaadatoknak felelnek meg. Kimball hozzáad egy harmadik kategóriát, a folyamat metaadatait . Másrészt a NISO három metaadat -típust különböztet meg: leíró, strukturális és adminisztratív.

A leíró metaadatokat általában felfedezésre és azonosításra használják, információként az objektumok kereséséhez és kereséséhez, például cím, szerző, tárgyak, kulcsszavak, kiadó. A strukturális metaadatok leírják az objektum összetevőinek megszervezését. A szerkezeti metaadatok egy példája lehet az, hogy az oldalakat hogyan rendezzük el egy könyv fejezeteihez. Végül az adminisztratív metaadatok információt adnak a forrás kezeléséhez. Az adminisztratív metaadatok a technikai információkra utalnak, beleértve a fájltípust, vagy a fájl létrehozásának idejére és módjára. Az adminisztratív metaadatok két altípusa a jogkezelési metaadatok és a megőrzési metaadatok. A jogkezelési metaadatok a szellemi tulajdonjogokat magyarázzák, míg a megőrzési metaadatok információkat tartalmaznak az erőforrás megőrzéséhez és mentéséhez.

A statisztikai adattárak saját követelményeket támasztanak a metaadatokkal szemben, hogy ne csak az adatok forrását és minőségét írják le, hanem azt is, hogy milyen statisztikai folyamatokat használtak az adatok létrehozásához, ami különösen fontos a statisztikai közösség számára az érvényesítés és a javítás érdekében a statisztikai adatok előállításának folyamata.

A metaadatok további, egyre fejlettebb típusa az akadálymentesítési metaadatok . A kisegítő lehetőségek metaadatai nem új fogalmak a könyvtárak számára; az egyetemes tervezés fejlődése azonban felemelte ismertségét. Az olyan projektek, mint a Cloud4All és a GPII, az egyetemes hozzáférési megoldások nagy hiányosságaként azonosították a felhasználók szükségleteit és preferenciáit leíró közös terminológiák és modellek hiányát, valamint az ezekhez az információkhoz illeszkedő információkat. Az ilyen típusú információk hozzáférhetőségi metaadatok. A Schema.org számos kisegítő tulajdonságot épített be az IMS Global Access for All Information Model Data Element Specification alapján. A WebSchemas/Accessibility Wiki oldal számos tulajdonságot és azok értékeit sorolja fel.

Míg az információkeresők változatos hozzáférhetőségi igényeinek leírására és szabványosítására irányuló erőfeszítések egyre erőteljesebbé válnak, a kialakított metaadat -sémákba való beépítésük még nem olyan fejlett. Például, míg a Dublin Core (DC) "közönsége" és a MARC 21 "olvasási szintje" felhasználható a diszlexiás felhasználók számára megfelelő erőforrások azonosítására, a DC "formátuma" pedig a Braille, audio vagy nagy nyomtatási formátumok, több munka vár még rá.

Szerkezetek

A metaadatok (metacontent) vagy helyesebben a metaadat-állítások (metacontent) összeállításához használt szókincsek általában egy szabványosított koncepció szerint vannak felépítve, jól definiált metaadat-sémát használva, beleértve: metaadat-szabványokat és metaadat-modelleket . Az olyan eszközök, mint az ellenőrzött szókincs , taxonómia , szinonimaszótár , adatszótárak és metaadat -nyilvántartások használhatók a metaadatok további szabványosítására. A strukturális metaadatok közössége is kiemelkedő fontosságú az adatmodell -fejlesztésben és az adatbázis -tervezésben .

Szintaxis

A metaadatok (metacontent) szintaxisa a metaadatok (metacontent) mezeinek vagy elemeinek strukturálására létrehozott szabályokra utal. Egyetlen metaadat -séma számos különböző jelölési vagy programozási nyelven fejezhető ki, amelyek mindegyike eltérő szintaxist igényel. Például a Dublin Core kifejezhető egyszerű szövegben, HTML -ben , XML -ben és RDF -ben .

Az (útmutató) metacontent gyakori példája a bibliográfiai besorolás, a tárgy, a Dewey Decimal osztályszáma . Mindig van egy hallgatólagos állítás valamilyen objektum "osztályozásában". Ahhoz, hogy egy objektumot például Dewey 514 -es osztályba sorolhassunk (Topológia) (azaz olyan könyvek, amelyek gerincén 514 -es szám szerepel), a hallgatólagos állítás a következő: "<könyv> <tárgycím> <514>". Ez egy alany-predikátum-objektum hármas, vagy ami még fontosabb, egy osztály-attribútum-érték hármas. A hármas első két eleme (osztály, attribútum) bizonyos strukturális metaadatok darabjai, amelyek meghatározott szemantikával rendelkeznek. A harmadik elem egy érték, lehetőleg valamilyen ellenőrzött szókincsből, néhány referencia (törzs) adatból. A metaadatok és a törzsadatok kombinációja egy olyan állítást eredményez, amely metacontent utasítás, azaz "metacontent = metaadatok + törzsadatok". Mindezeket az elemeket "szókincsnek" lehet tekinteni. Mind a metaadatok, mind a törzsadatok olyan szókincsek, amelyeket metacontent utasításokra lehet összeállítani. Ezeknek a szókincseknek sok forrása van, mind meta-, mind törzsadatok: UML, EDIFACT, XSD, Dewey/UDC/LoC, SKOS, ISO-25964, Pantone, Linnaean Binomial Nomenclature stb. akár indexelésre, akár keresésre, az ISO 25964 jóváhagyja : "Ha mind az indexelő, mind a kereső ugyanazt a fogalmat választja ugyanarra a fogalomra, akkor a releváns dokumentumok lekérésre kerülnek." Ez különösen akkor fontos, ha figyelembe vesszük az internet keresőmotorjait, például a Google -t. A folyamat indexeli az oldalakat, majd összetett algoritmusa alapján illeszti a szöveges karakterláncokat; nem történik intelligencia vagy "kikövetkeztetés", csak annak illúziója.

Hierarchikus, lineáris és síkbeli sémák

A metaadat-sémák hierarchikus jellegűek lehetnek, ahol kapcsolatok léteznek a metaadat-elemek között, és az elemek egymásba vannak ágyazva, így a szülő-gyermek kapcsolatok léteznek az elemek között. Egy példa a hierarchikus metaadat -sémára az IEEE LOM séma, amelyben a metaadat -elemek egy szülő metaadat -elemhez tartozhatnak. A metaadat-sémák lehetnek egydimenziósak vagy lineárisak is, ahol minden elem teljesen elkülönül más elemektől, és csak egy dimenzió szerint osztályozható. Egy példa a lineáris metaadat -sémára a Dublin Core séma, amely egydimenziós. A metaadat -sémák gyakran kétdimenziósak vagy síkiak, ahol minden elem teljesen elkülönül más elemektől, de két ortogonális dimenzió szerint van besorolva.

Részletesség

Az adatok vagy metaadatok felépítésének mértékét "szemcsésségnek" nevezzük . A "részletesség" azt jelzi, hogy mennyi részlet van megadva. A nagy részletességű metaadatok mélyebb, részletesebb és strukturáltabb információkat tesznek lehetővé, és nagyobb szintű technikai manipulációt tesznek lehetővé. Az alacsonyabb részletesség azt jelenti, hogy a metaadatok lényegesen alacsonyabb költségek mellett hozhatók létre, de nem nyújtanak részletes információt. A részletesség legnagyobb hatása nemcsak a létrehozásra és rögzítésre, hanem a karbantartási költségekre is hatással van. Amint a metaadat -struktúrák elavulttá válnak, a hivatkozott adatokhoz való hozzáférés is. Ezért a részletességnek figyelembe kell vennie a metaadatok létrehozására irányuló erőfeszítéseket, valamint azok fenntartására irányuló erőfeszítéseket.

Hypermapping

Minden olyan esetben, amikor a metaadat -sémák meghaladják a síkbeli ábrázolást, bizonyos típusú hiperleképezésre van szükség a metaadatok kiválasztott szempont szerinti megjelenítéséhez és megtekintéséhez, valamint speciális nézetek megjelenítéséhez. A hiperképzés gyakran vonatkozik a földrajzi és földtani információfedvények rétegezésére.

Szabványok

A metaadatokra nemzetközi szabványok vonatkoznak. Sok munka folyik a nemzeti és nemzetközi szabványközösségekben, különösen az ANSI -ben (Amerikai Nemzeti Szabványügyi Intézet) és az ISO -ban (Nemzetközi Szabványügyi Szervezet) a metaadatok és nyilvántartások szabványosítására vonatkozó konszenzus elérése érdekében. A fő metaadat-nyilvántartási szabvány az ISO / IEC 11179 Metadata Registries (MDR), a szabvány keretét az ISO / IEC 11179-1: 2004 írja le. Az 1. rész új kiadása a végső stádiumban van, hogy 2015-ben vagy 2016 elején kerüljön közzétételre. Átdolgozták, hogy megfeleljen az ISO/IEC 11179-3: 2013 3. rész jelenlegi kiadásának, amely kiterjeszti az MDR-t a koncepció regisztrációjának támogatására. Rendszerek. (lásd ISO/IEC 11179 ). Ez a szabvány egy sémát határoz meg az adatok jelentésének és technikai felépítésének rögzítésére, az emberek és a számítógépek egyértelmű használatára. Az ISO/IEC 11179 szabvány a metaadatokra az adatokkal kapcsolatos információobjektumokat vagy "adatokról szóló adatokat" említi. Az ISO/IEC 11179 3. részében az információobjektumok az adatelemekről, értéktartományokról és más, többször felhasználható szemantikai és ábrázolási információs objektumokról származó adatok, amelyek leírják az adatok jelentését és technikai részleteit. Ez a szabvány a metaadat -nyilvántartás részleteit, valamint a metaadat -nyilvántartásban lévő információs objektumok regisztrálását és kezelését is előírja. Az ISO/IEC 11179 3. rész rendelkezéseket is tartalmaz az összetett szerkezetek leírására, amelyek más adatelemekből származnak, például számítások, egy vagy több adatelem gyűjtése vagy más származtatott adatok révén. Noha ez a szabvány eredetileg "adatelem" nyilvántartásként írja le magát, célja, hogy támogassa a metaadat -tartalom leírását és regisztrálását bármely adott alkalmazástól függetlenül, a leírásokat kölcsönözve, hogy az emberek vagy a számítógépek felfedezzék és újrafelhasználják az új alkalmazások, adatbázisok vagy a regisztrált metaadat -tartalomnak megfelelően gyűjtött adatok elemzésére. Ez a szabvány lett az általános alap más típusú metaadat -nyilvántartásokhoz, újrafelhasználva és kiterjesztve a szabvány regisztrációs és adminisztrációs részét.

A térinformatikai közösség hagyományai a speciális térinformatikai metaadat- szabványok, különösen a térkép- és képkönyvtárak és katalógusok hagyományaira építve. A formális metaadatok általában elengedhetetlenek a térinformatikai adatokhoz, mivel a közös szövegfeldolgozási megközelítések nem alkalmazhatók.

A Dublin Core metaadat -kifejezések olyan szókincs -kifejezések, amelyek felhasználhatók a felfedezéshez szükséges erőforrások leírására. A 15 klasszikus metaadat -kifejezés eredeti készlete, a Dublin Core Metadata Element Set, a következő szabványdokumentumokban található:

  • IETF RFC 5013
  • ISO szabvány 15836-2009
  • NISO szabvány Z39.85.

A W3C Data Catalog Vocabulary (DCAT) egy RDF szókincs, amely kiegészíti a Dublin Core -t az adatkészlet, az adatszolgáltatás, a katalógus és a katalógusrekord osztályaival. A DCAT a FOAF, a PROV-O és az OWL-Time elemeit is használja. A DCAT RDF modellt biztosít a katalógus tipikus felépítésének támogatására, amely rekordokat tartalmaz, mindegyik adatkészletet vagy szolgáltatást ír le.

Bár nem szabványos, a mikroformátum (amelyet az alábbi internetes metaadatok részben is említünk ) a szemantikai jelölés webes megközelítése, amely a meglévő HTML/XHTML címkék újbóli felhasználására törekszik a metaadatok továbbítására. A mikroformátum követi az XHTML és HTML szabványokat, de önmagában nem szabvány. A mikroformátumok egyik támogatója, Tantek Çelik az alternatív megközelítésekkel kapcsolatos problémát jellemezte:

Itt van egy új nyelv, amelyet szeretnénk, ha megtanulna, és most ki kell adnia ezeket a további fájlokat a szerverén. Ez gond. (Mikroformátumok) csökkenti a belépés akadályát.

Használat

Fényképek

A metaadatokat digitális fényképfájlba lehet írni , amely azonosítja, hogy ki a tulajdonosa, szerzői jogi és elérhetőségi adatai, milyen márkájú vagy modellű fényképezőgép hozta létre a fájlt, valamint expozíciós információk (zársebesség, f-stop stb.) És leíró információk, mint például a fényképre vonatkozó kulcsszavak, a fájl vagy kép kereshetővé tétele a számítógépen és/vagy az interneten. Bizonyos metaadatokat a kamera hoz létre, másokat pedig a fotós és/vagy a szoftver a számítógépre való letöltés után. A legtöbb digitális fényképezőgép metaadatokat ír a modellszámról, a zársebességről stb., És néhányuk lehetővé teszi azok szerkesztését; ez a funkció a Nikon D3 óta elérhető a legtöbb Nikon DSLR fényképezőgépen, a legtöbb új Canon fényképezőgépen a Canon EOS 7D óta , és a legtöbb Pentax DSLR gépen a Pentax K-3 óta. A metaadatok felhasználhatók az utómunkálatok szervezésének megkönnyítésére a kulcsszavak használatával. A szűrők felhasználhatók egy adott fényképkészlet elemzésére, és kiválaszthatók olyan kritériumok alapján, mint a minősítés vagy a rögzítési idő. A földrajzi helymeghatározási képességgel rendelkező eszközökön, például a GPS -en (különösen az okostelefonokon) a fénykép készítésének helye is szerepelhet.

A fényképészeti metaadat -szabványokat az alábbi szabványokat kidolgozó szervezetek szabályozzák. Ide tartoznak, de nem kizárólagosan:

  • IPTC információcsere -modell IIM (International Press Telecommunications Council)
  • IPTC Core Schema for XMP
  • XMP - bővíthető metaadat -platform (ISO szabvány)
  • Exif - Cserélhető képfájl -formátum, fenntartja a CIPA (Camera & Imaging Products Association) és közzéteszi a JEITA (Japan Electronics and Information Technology Industries Association)
  • Dublin Core (Dublin Core Metadata Initiative - DCMI)
  • PLUS (képengedélyezési univerzális rendszer)
  • VRA Core (Vizuális Erőforrás Egyesület)

Távközlés

A telefonhívások, elektronikus üzenetek, azonnali üzenetek és más távközlési módok idejére, eredetére és rendeltetési helyére vonatkozó információ, szemben az üzenetek tartalmával, a metaadatok egy másik formája. Ennek a felhívásnak a gdetail rekord metaadatainak tömeges gyűjtése hírszerző ügynökségek részéről ellentmondásosnak bizonyult, miután Edward Snowden nyilvánosságra hozta , hogy egyes hírszerző ügynökségek, mint például az NSA, (és talán még most is) online metaadatokat tároltak több millió internetfelhasználón akár egy évig évben, függetlenül attól, hogy [valaha] az ügynökség számára érdekes személyek voltak -e vagy sem.

Videó

A metaadatok különösen hasznosak a videókban, ahol a tartalmukra vonatkozó információkat (például a beszélgetések átiratait és a jelenetek szöveges leírásait) a számítógép nem érti közvetlenül, de ahol a tartalom hatékony keresése kívánatos. Ez különösen hasznos olyan videoalkalmazásokban, mint az automatikus rendszámtábla -felismerés és a járműfelismerő azonosító szoftver, ahol a rendszámadatokat elmenti, és jelentéseket és riasztásokat készít. A videó metaadatai két forrásból származnak: (1) operatív összegyűjtött metaadatok, azaz az előállított tartalomra vonatkozó információk, például a berendezés típusa, szoftver, dátum és hely; (2) ember által készített metaadatok a keresőmotor láthatóságának, felfedezésének, közönség elkötelezettségének javítása, valamint hirdetési lehetőségek biztosítása érdekében a videokiadók számára. A mai társadalomban a legtöbb professzionális videószerkesztő szoftver hozzáfér a metaadatokhoz. Az Avid MetaSync és az Adobe Bridge két kiváló példa erre.

Földrajzi metaadatok

A térinformatikai metaadatok a földrajzi információs rendszerek (GIS) fájljaihoz, térképeihez, képeihez és más, helyalapú adatokhoz kapcsolódnak. A metaadatokat a GIS a földrajzi adatok jellemzőinek és attribútumainak dokumentálására használja, mint például az adatbázisfájlok és a térinformatikai rendszerben kifejlesztett adatok. Olyan részleteket tartalmaz, mint például az, hogy ki fejlesztette ki az adatokat, mikor gyűjtötték őket, hogyan dolgozzák fel, milyen formátumokban érhetők el, majd megjeleníti az adatok hatékony felhasználásának kontextusát.

Teremtés

A metaadatok automatikus információfeldolgozással vagy kézi munkával hozhatók létre. A számítógépek által rögzített elemi metaadatok tartalmazhatnak információkat arról, hogy mikor hoztak létre objektumot, ki hozta létre, mikor frissítette utoljára, a fájl méretét és a fájl kiterjesztését. Ebben az összefüggésben az objektum a következők bármelyikére utal:

  • Fizikai tárgy, például könyv, CD, DVD, papírtérkép, szék, asztal, virágcserép stb.
  • Elektronikus fájl, például digitális kép, digitális fénykép, elektronikus dokumentum, programfájl, adatbázis -táblázat stb.

A metaadat -motor összegyűjti, tárolja és elemzi a tartományon belül használt adatokról és metaadatokról (adatokról szóló adatokat).

Adat virtualizáció

Az adat virtualizáció a 2000 -es években jelent meg, mint új szoftvertechnológia, amely befejezi a vállalati virtualizációs "verem" használatát. A metaadatokat az adatok virtualizációs kiszolgálóin használják, amelyek vállalati infrastruktúra -összetevők, az adatbázis- és alkalmazáskiszolgálók mellett. Ezeken a szervereken a metaadatok állandó adattárként kerülnek mentésre, és különböző vállalati rendszerekben és alkalmazásokban lévő üzleti objektumokat írnak le . A strukturális metaadatok közössége szintén fontos az adatok virtualizációjának támogatásához.

Statisztikai és népszámlálási szolgáltatások

A szabványosítási és harmonizációs munkák előnyt jelentettek az iparág azon törekvéseiben, amelyek a statisztikai közösség metaadat -rendszereinek kiépítésére irányulnak. Számos metaadatokra vonatkozó iránymutatás és szabvány, például az Európai Statisztikai Gyakorlati Kódex és az ISO 17369: 2013 ( Statisztikai adatok és metaadatcsere vagy SDMX) kulcsfontosságú elveket tartalmaz arra vonatkozóan, hogy a vállalkozásoknak, kormányzati szerveknek és más szervezeteknek hogyan kell kezelniük a statisztikai adatokat és metaadatokat. Az olyan szervezetek, mint az Eurostat , a Központi Bankok Európai Rendszere és az Egyesült Államok Környezetvédelmi Ügynöksége végrehajtották ezeket és más hasonló szabványokat és iránymutatásokat azzal a céllal, hogy javítsák a "hatékonyságot a statisztikai üzleti folyamatok kezelésében".

Könyvtár és információs tudomány

A metaadatokat különböző módokon használták a könyvtárak tételeinek digitális és analóg formátumú katalogizálására. Az ilyen adatok segítenek osztályozni, összesíteni, azonosítani és megtalálni egy adott könyvet, DVD -t, folyóiratot vagy bármely olyan tárgyat, amelyet a könyvtár gyűjteményében tarthat. Az 1980-as évekig sok könyvtári katalógusban 3x5 hüvelykes kártyákat használtak az iratfiókokban, hogy megjelenítsék a könyv címét, szerzőjét, tárgyát és egy rövidített alfanumerikus karakterláncot ( hívószámot ), amely jelzi a könyv fizikai helyét a könyvtár polcain. A könyvtárak által a könyvtári anyagok tantárgy szerinti osztályozására alkalmazott Dewey tizedesrendszer a metaadatok használatának korai példája. Az 1980 -as és 1990 -es évektől kezdve sok könyvtár lecserélte ezeket a papírfájl -kártyákat számítógépes adatbázisokra. Ezek a számítógépes adatbázisok sokkal könnyebbé és gyorsabbá teszik a felhasználók számára a kulcsszókeresést. A régebbi metaadatgyűjtés másik formája az Egyesült Államok népszámlálási hivatala által az úgynevezett "hosszú forma". A Hosszú űrlap olyan kérdéseket tesz fel, amelyeket demográfiai adatok létrehozására használnak, hogy megtalálják az eloszlási mintákat. A könyvtárak metaadatokat használnak a könyvtári katalógusokban , leggyakrabban az integrált könyvtárkezelő rendszer részeként . A metaadatokat források, például könyvek, folyóiratok, DVD -k, weboldalak vagy digitális képek katalogizálásával nyerik . Ezeket az adatokat az integrált könyvtárkezelő rendszerben, az ILMS -ben tárolják a MARC metaadat -szabvány használatával. A cél az, hogy a védnököket az általuk keresett tételek vagy területek fizikai vagy elektronikus helyére irányítsa, valamint leírást adjon a kérdéses elemről.

A könyvtári metaadatok újabb és speciális példái közé tartozik a digitális könyvtárak létrehozása, beleértve az e-print tárolókat és a digitális képkönyvtárakat. Bár gyakran a könyvtári elveken alapul, a nem könyvtári használatra való összpontosítás, különösen a metaadatok biztosításakor, azt jelenti, hogy nem követik a hagyományos vagy közös katalógusos megközelítéseket. Tekintettel a mellékelt anyagok egyedi jellegére, a metaadatmezőket gyakran speciálisan hozzák létre, például rendszertani osztályozási mezőket, helymezőket, kulcsszavakat vagy szerzői jogi nyilatkozatot. A szabványos fájlinformációk, például a fájl mérete és formátuma általában automatikusan szerepelnek. A könyvtári működés évtizedek óta kulcsfontosságú téma a nemzetközi szabványosítás érdekében . A digitális könyvtárak metaadataira vonatkozó szabványok közé tartozik a Dublin Core , a METS , a MODS , a DDI , a DOI , az URN , a PREMIS séma, az EML és az OAI-PMH . A világ vezető könyvtárai tippeket adnak a metaadat -szabványokkal kapcsolatos stratégiáikhoz.

A múzeumokban

A metaadatok múzeumi kontextusban azok az információk, amelyeket képzett kulturális dokumentációs szakemberek, például levéltárosok , könyvtárosok , múzeumi nyilvántartók és kurátorok hoznak létre a műalkotások, építészet, kulturális tárgyak és képeik indexelésére, strukturálására, leírására, azonosítására vagy más módon történő meghatározására. A leíró metaadatokat leggyakrabban múzeumi környezetben használják objektum azonosítására és erőforrás -helyreállítási célokra.

Használat

A metaadatokat gyűjtőintézetekben és múzeumokban dolgozzák ki és alkalmazzák annak érdekében, hogy:

  • Elősegíti az erőforrások felfedezését és végrehajtja a keresési lekérdezéseket.
  • Hozzon létre digitális archívumokat, amelyek a múzeumi gyűjtemények és kulturális tárgyak különböző vonatkozásaival kapcsolatos információkat tárolják, és archiválási és menedzsment célokat szolgálnak.
  • Biztosítsa a nyilvánosság számára a kulturális tárgyakhoz való hozzáférést digitális tartalom online közzétételével.

Szabványok

Sok múzeum és kulturális örökségvédelmi központ elismeri, hogy a műalkotások és kulturális tárgyak sokféleségére való tekintettel egyetlen modell vagy szabvány sem elegendő a kulturális művek leírásához és katalógusához. Például egy faragott bennszülött műtárgyat műalkotásnak, régészeti műtárgynak vagy bennszülött örökségnek lehet minősíteni. A múzeumi közösségen belüli archiválás, leírás és katalogizálás szabványosításának korai szakaszai a kilencvenes évek végén kezdődtek, olyan szabványok kidolgozásával, mint a Műalkotások leírásának kategóriái (CDWA), a Spectrum, a CIDOC Conceptual Reference Model (CRM), a Cataloging Kulturális objektumok (CCO) és a CDWA Lite XML séma. Ezek a szabványok HTML és XML jelölési nyelveket használnak a gépi feldolgozáshoz, közzétételhez és megvalósításhoz. Az angol-amerikai katalógusszabályokat (AACR), amelyeket eredetileg a könyvek jellemzésére fejlesztettek ki, kulturális tárgyakra, műalkotásokra és építészetre is alkalmaztak. A szabványok, mint például a CCO, a múzeum gyűjteménykezelő rendszerébe (CMS), egy adatbázisba vannak integrálva , amely adatbázis révén a múzeumok kezelhetik gyűjteményeiket, beszerzéseiket, kölcsönzéseiket és megőrzésüket. A tudósok és a szakemberek megjegyzik, hogy a „gyorsan fejlődő szabványok és technológiák” kihívásokat jelentenek a kulturális dokumentumfilmesek, különösen a nem műszakilag képzett szakemberek számára. A legtöbb gyűjtő intézmény és múzeum relációs adatbázist használ a kulturális alkotások és képeik kategorizálására. A relációs adatbázisok és a metaadatok dokumentálják és leírják a kulturális tárgyak és a sokoldalú műalkotások, valamint a tárgyak és helyek, emberek és művészi mozgalmak közötti összetett kapcsolatokat. A relációs adatbázis -struktúrák a gyűjtőintézetekben és a múzeumokban is előnyösek, mivel lehetővé teszik a levéltárosok számára, hogy egyértelmű különbséget tegyenek a kulturális tárgyak és képeik között; az egyértelmű megkülönböztetés zavaró és pontatlan keresésekhez vezethet.

Kulturális tárgyak és műalkotások

Az objektum tárgyilagossága, funkciója és célja, valamint a múzeum és a gyűjtemény mérete (pl. Mérések, például magasság, szélesség, súly), tárolási követelmények (pl. Éghajlatvezérelt környezet) és fókusza befolyásolják a leírás mélységét. a kulturális dokumentaristák által az objektumnak tulajdonított adatok. A kulturális dokumentaristák kialakított intézményi katalogizálási gyakorlatai, céljai és szakértelme, valamint az adatbázis -struktúra szintén befolyásolja a kulturális tárgyakhoz rendelt információkat és a kulturális objektumok kategorizálásának módjait. Ezenkívül a múzeumok gyakran használnak szabványosított kereskedelmi gyűjteménykezelő szoftvert, amely előírja és korlátozza a levéltárosok műalkotások és kulturális tárgyak leírásának módját. Emellett a gyűjtőintézetek és múzeumok ellenőrzött szókincseket használnak a gyűjteményükben található kulturális tárgyak és műalkotások leírására. A Getty Vocabularies és a Kongresszusi Könyvtár ellenőrzött szókincsei jó hírűek a múzeumi közösségben, és a CCO szabványok ajánlják. A múzeumokat arra ösztönzik, hogy olyan, ellenőrzött szókincseket használjanak, amelyek kontextuson alapulnak és gyűjteményeik szempontjából relevánsak, és javítják digitális információs rendszereik funkcionalitását. Az ellenőrzött szótárak előnyösek az adatbázisokban, mivel magas szintű következetességet biztosítanak, javítva az erőforrások visszakeresését. A metaadat -struktúrák, beleértve az ellenőrzött szókincseket is, azoknak a rendszereknek az ontológiáit tükrözik , amelyekből létrehozták őket. Gyakran azok a folyamatok, amelyek révén a kulturális tárgyakat a múzeumokban metaadatokon keresztül írják le és kategorizálják, nem tükrözik a készítő közösségek nézőpontját.

Múzeumok és az Internet

A metaadatok fontos szerepet játszottak a digitális információs rendszerek és archívumok létrehozásában a múzeumokban, és megkönnyítették a múzeumok számára a digitális tartalmak online közzétételét. Ez lehetővé tette azoknak a közönségeknek a hozzáférését, akik földrajzi vagy gazdasági akadályok miatt nem juthattak hozzá kulturális objektumokhoz. A 2000 -es években, amikor egyre több múzeum fogadta el a levéltári szabványokat és bonyolult adatbázisokat hozott létre, a múzeumi, levéltári és könyvtártudományi közösségekben felmerültek a múzeumi adatbázisok közötti viták a kapcsolt adatokról . A gyűjteménykezelő rendszerek (CMS) és a digitális vagyonkezelő eszközök lehetnek helyi vagy megosztott rendszerek. A digitális humán tudósok megjegyzik a múzeumi adatbázisok és gyűjtemények közötti interoperabilitás számos előnyét, ugyanakkor elismerik az ilyen interoperabilitás elérésének nehézségeit.

Törvény

Egyesült Államok

Elterjedtek azok a problémák, amelyek a metaadatokat érintik az Egyesült Államokban folyó perekben . A bíróságok különböző, metaadatokkal kapcsolatos kérdéseket vizsgáltak, beleértve a metaadatok felek általi felfedezhetőségét . Bár a szövetségi polgári perrendtartás csak az elektronikus dokumentumokra vonatkozó szabályokat határozott meg, a későbbi ítélkezési gyakorlat részletezte a felek metaadatok közzétételére vonatkozó követelményét. 2009 októberében az arizonai legfelsőbb bíróság kimondta, hogy a metaadat -nyilvántartások nyilvánosak . A dokumentumok metaadatai különösen fontosnak bizonyultak azokban a jogi környezetekben, amelyekben a peres eljárások metaadatokat kértek, és amelyek tartalmazhatnak olyan érzékeny információkat, amelyek kárt okoznak a bíróságon egy adott félnek. A metaadat -eltávolító eszközök használata a dokumentumok "tisztítására" vagy szerkesztésére csökkentheti az érzékeny adatok akaratlan küldésének kockázatát. Ez a folyamat részben (lásd az adatok remanenciáját ) megvédi az ügyvédi irodákat az érzékeny adatok elektronikus felfedezés révén esetlegesen káros szivárgásától .

A közvélemény -kutatások kimutatták, hogy az amerikaiak 45% -a "egyáltalán nem biztos" abban, hogy a közösségi oldalak képesek biztosítani személyes adatainak biztonságát, és 40% -uk szerint a közösségi média oldalak nem tárolhatnak semmilyen információt az egyénekről. Az amerikaiak 76% -a azt mondja, hogy nem biztos abban, hogy a reklámügynökségek által gyűjtött információk biztonságosak, és 50% -uk szerint az online hirdetési ügynökségeknek egyáltalán nem szabad megengedni, hogy adataikat rögzítsék.

Ausztrália

Ausztráliában a nemzetbiztonság megerősítésének szükségessége új metaadat -tárolási törvény bevezetését eredményezte. Ez az új törvény azt jelenti, hogy mind a biztonsági, mind a rendészeti szervek legfeljebb két évig férhetnek hozzá az egyén metaadataihoz, azzal a céllal, hogy megkönnyítsék a terrorista támadások és a súlyos bűncselekmények megállítását.

A törvényhozásban

A jogalkotási metaadatokkal kapcsolatban néhány vita tárgyát képezték a law.gov fórumokon, például a Cornell Law School Jogi Információs Intézetének 2010. március 22–23 -án tartott workshopjain . Ezeknek a fórumoknak a dokumentációja a „Javasolt metaadat -gyakorlatok a jogalkotáshoz és előírások."

Ezek a megbeszélések néhány kulcsfontosságú pontot vázoltak fel, amelyek szakaszának címei a következők:

  • Általános szempontok
  • Dokumentum szerkezete
  • A dokumentum tartalma
  • Metaadatok (elemek)
  • Rétegezés
  • Pont-in-time kontra post-hoc

Az egészségügyben

Az ausztrál orvosi kutatás úttörő szerepet játszott a metaadatok meghatározásában az egészségügyi ellátásban. Ez a megközelítés az első elismert kísérlet az orvosi tudományok nemzetközi szabványainak betartására, ahelyett, hogy az Egészségügyi Világszervezet (WHO) keretén belül saját szabványt határozna meg. Az orvosi közösség még nem hagyta jóvá a metaadat -szabványok követésének szükségességét, annak ellenére, hogy ezeket a szabványokat alátámasztó kutatások folytak.

Az orvosbiológiai kutatásokban

A biomedicina és a molekuláris biológia területén végzett kutatások gyakran nagy mennyiségű adatot adnak, beleértve a genom- vagy meta-genom szekvenálás eredményeit , a proteomikai adatokat, sőt a kutatás során készített jegyzeteket vagy terveket. Minden adattípus magában foglalja a saját metaadatait és a metaadatok előállításához szükséges folyamatokat. Az általános metaadat-szabványok, mint például az ISA-Tab, lehetővé teszik a kutatók számára, hogy konzisztens formátumban hozzanak létre és cseréljenek kísérleti metaadatokat. Az egyes kísérleti megközelítéseknek gyakran saját metaadat -szabványaik és rendszereik vannak: a tömegspektrometria metaadat -standardjai közé tartozik az mzML és az SPLASH, míg az XML -alapú szabványok, mint például a PDBML és az SRA XML, a makromolekuláris szerkezet és a szekvenálási adatok szabványai.

Az orvosbiológiai kutatások termékeit általában lektorált kéziratok formájában valósítják meg, és ezek a kiadványok egy újabb adatforrás. Az orvosbiológiai kiadványok metaadatait gyakran folyóiratkiadók és idéző ​​adatbázisok, például a PubMed és a Web of Science készítik . A kéziratokban található, vagy kiegészítő anyagként kísérő adatok ritkábban tartoznak metaadatok létrehozásához, bár közzétételük után biomedikai adatbázisokhoz is benyújthatók. Az eredeti szerzők és adatbázis -kurátorok ezután felelősek a metaadatok létrehozásáért, automatizált folyamatok segítségével. Átfogó metaadatok minden kísérleti adatok alapja a FAIR vezérelvei , vagy a standardok biztosítása érdekében a kutatási adatok kereshető , hozzáférhető , interoperábilis és újrahasználható .

Adattárolás

Az adattárház (DW) a szervezet elektronikusan tárolt adatainak tárháza. Az adattárházak célja az adatok kezelése és tárolása. Az adattárházak különböznek az üzleti intelligencia (BI) rendszerektől, mivel a BI rendszereket úgy tervezték, hogy az adatokat felhasználva készítsenek jelentéseket és elemezzék az információkat, és stratégiai útmutatást nyújtsanak a menedzsment számára. A metaadatok fontos eszköz az adatok tárolásában az adattárházakban. Az adattárház célja szabványosított, strukturált, következetes, integrált, helyes, "tisztított" és időszerű adatok tárolása a szervezet különböző operációs rendszereiből. A kinyert adatok integrálva vannak az adattárház környezetébe, hogy vállalati szintű perspektívát nyújtsanak. Az adatok úgy vannak felépítve, hogy kiszolgálják a jelentési és elemzési követelményeket. A szerkezeti metaadatok közös jellegének megtervezése adatmodellezési módszerrel, például entitáskapcsolati modell diagrammal, fontos minden adattárház fejlesztési erőfeszítésben. Részletesen részletezik a metaadatokat az adattárház minden egyes adatán. Az adattárház / üzleti intelligencia rendszer lényeges alkotóeleme a metaadatok és a metaadatok kezelésére és lekérésére szolgáló eszközök. Ralph Kimball a metaadatokat az adattárház DNS -ének írja le, mivel a metaadatok határozzák meg az adattárház elemeit és azok együttes működését.

Kimball és mtsai. a metaadatok három fő kategóriájára vonatkozik: Műszaki metaadatok, üzleti metaadatok és folyamat metaadatok. A technikai metaadatok elsősorban meghatározó jellegűek , míg az üzleti metaadatok és a folyamatok metaadatai elsősorban leíró jellegűek . A kategóriák néha átfedik egymást.

  • A technikai metaadatok technikai szempontból határozzák meg a DW/BI rendszer objektumait és folyamatait. A műszaki metaadatok magukban foglalják a rendszer metaadatait, amelyek meghatározzák az adatstruktúrákat, például táblázatokat, mezőket, adattípusokat, indexeket és partíciókat a relációs motorban, valamint adatbázisokat, méreteket, mértékeket és adatbányászati ​​modelleket. A technikai metaadatok határozzák meg az adatmodellt és a felhasználók megjelenítési módját, a jelentéseket, ütemezéseket, terjesztési listákat és felhasználói biztonsági jogokat.
  • Az üzleti metaadatok felhasználóbarátabb kifejezésekkel leírt tartalom az adattárházból. Az üzleti metaadatok megmondják, hogy milyen adatai vannak, honnan származnak, mit jelentenek és milyen kapcsolatban állnak az adattárház többi adatával. Az üzleti metaadatok dokumentációként is szolgálhatnak a DW/BI rendszerhez. Az adattárházat böngésző felhasználók elsősorban az üzleti metaadatokat tekintik meg.
  • A folyamat metaadatai az adattárházban végzett különböző műveletek eredményeinek leírására szolgálnak. Az ETL folyamaton belül a feladatok minden fontos adata naplózásra kerül a végrehajtás során. Ez magában foglalja a kezdési időt, a befejezési időt, a használt CPU másodperceket, a lemez olvasásait, a lemez írásait és a feldolgozott sorokat. Az ETL vagy lekérdezési folyamat hibaelhárításakor az ilyen típusú adatok értékesekké válnak. A folyamat metaadatai a tények mérése DW/BI rendszer építésekor és használatakor. Egyes szervezetek abból élnek, hogy ilyen típusú adatokat gyűjtenek és értékesítenek a vállalatoknak - ebben az esetben a folyamat metaadatai a tény- és dimenziótáblák üzleti metaadataivá válnak. A folyamat metaadatainak gyűjtése az üzletemberek érdeke, akik az adatok alapján azonosíthatják termékeik felhasználóit, mely termékeket használnak, és milyen szintű szolgáltatást kapnak.

Az interneten

A weboldalak meghatározására használt HTML formátum lehetővé teszi számos metaadat beépítését, az alapvető leíró szövegektől, dátumoktól és kulcsszavaktól a további fejlett metaadatsémákig, például a Dublin Core , az e-GMS és az AGLS szabványokig. Oldalak is geocímkézett a koordinátákat . A metaadatok szerepelhetnek az oldal fejlécében vagy külön fájlban. A mikroformátumok lehetővé teszik a metaadatok hozzáadását az oldalas adatokhoz oly módon, amelyet a rendszeres webfelhasználók nem látnak, de a számítógépek, a webrobotok és a keresőmotorok könnyen hozzáférhetnek. Sok keresőmotor óvatosan használja a metaadatokat rangsorolási algoritmusaiban a metaadatok kiaknázása és a keresőoptimalizálás ( SEO) gyakorlata miatt a rangsor javítása érdekében. További vitákért lásd a Meta elem cikkét. Ez az óvatos hozzáállás indokolt lehet, mivel az emberek Doctorow szerint nem hajtanak végre gondosságot és gondosságot saját metaadataik létrehozásakor, és a metaadatok egy olyan versenykörnyezet részét képezik, ahol a metaadatokat a metaadat -alkotók saját céljainak népszerűsítésére használják. Tanulmányok azt mutatják, hogy a keresőmotorok metaadat -megvalósításokkal válaszolnak a weboldalakra, a Google pedig egy hirdetményt tartalmaz a webhelyén, amely bemutatja a keresőmotor által értett metacímkéket. A vállalati keresés indítása A Swiftype a metaadatokat relevanciajelként ismeri fel, amelyet a webmesterek megvalósíthatnak webhely-specifikus keresőmotorjukhoz, még a saját, Meta Tags 2 nevű kiterjesztésük kiadásával is.

A műsorszóró iparban

A műsorszórási iparban a metaadatok az alábbi audio- és videóközvetítő médiumokhoz vannak kapcsolva :

  • azonosítsa a médiát: klip vagy lejátszási lista neve, időtartama, időkódja stb.
  • írja le a tartalmat: megjegyzések a videotartalom minőségével, értékelésével, leírásával kapcsolatban (például egy sportesemény során egyes klipekhez olyan kulcsszavakat társítanak, mint a cél , a piros lap )
  • Osztályozza média: metaadatok lehetővé teszi a gyártóknak, hogy rendezze a média, illetve könnyen és gyorsan megtalálja a video tartalmat (a híreket is sürgősen szükség van néhány archívumot egy tárgy). Például a BBC-nek van egy nagy tárgyosztályozási rendszere, a Lonclass , az általánosabb univerzális tizedes osztályozás személyre szabott változata .

Ez a metaadat a videószervereknek köszönhetően összekapcsolható a videomédiával . A legtöbb nagy sugárzott sportesemény, mint például a FIFA Világkupa vagy az olimpiai játékok, ezeket a metaadatokat használja fel, hogy kulcsszavakon keresztül terjesszék videotartalmaikat a tévéállomásoknak . Gyakran a fogadó műsorszolgáltató felelős a metaadatok nemzetközi műsorszóró központján és videószerverein keresztül történő megszervezéséért . Ezeket a metaadatokat rögzített képek és beírni a metaadatok szereplők ( favágók ), aki társult élő metaadatok rendelkezésre metaadatok hálózatok révén szoftverek (például a Multicam (LSM) vagy IPDirector során a FIFA World Cup, vagy olimpia).

Földrajzi

A földrajzi objektumokat elektronikus tárolóban vagy formátumban leíró metaadatok (például adathalmazok, térképek, szolgáltatások vagy földrajzi térbeli összetevővel rendelkező dokumentumok) története legalább 1994 -re nyúlik vissza (lásd az MIT Library oldalát az FGDC metaadatain ). Ezt a metaadat -osztályt részletesebben a földrajzi metaadat -cikk írja le .

Ökológiai és környezeti

Az ökológiai és környezeti metaadatok célja egy adott tanulmány adatgyűjtésének "ki, mit, mikor, hol, miért és hogyan" dokumentálása. Ez jellemzően azt jelenti, hogy melyik szervezet vagy intézmény gyűjtötte az adatokat, milyen típusú adatok, melyik dátum (ok) ban gyűjtötték az adatokat, az adatgyűjtés indoklása és az adatgyűjtéshez használt módszertan. A metaadatokat a legrelevánsabb tudományos közösség által általánosan használt formátumban kell létrehozni, például Darwin Core , Ecological Metadata Language vagy Dublin Core . Vannak metaadat -szerkesztő eszközök a metaadatok létrehozásának megkönnyítésére (pl. Metavist, Mercury , Morpho). A metaadatoknak leírniuk kell az adatok eredetét (ahol keletkeztek, valamint az adatok esetleges átalakításait), és hogyan kell hitelt adni (idézni) az adattermékeket.

Digitális zene

Amikor először megjelent 1982 -ben, a Compact Discs csak tartalomjegyzéket (TOC) tartalmazott, amely tartalmazza a lemezen található műsorszámok számát és hosszát a mintákban. Tizennégy évvel később, 1996-ban a CD Red Book szabvány felülvizsgálata CD-szöveget adott hozzá a további metaadatokhoz. A CD-szöveget azonban nem fogadták el széles körben. Röviddel ezután általánossá vált, hogy a személyi számítógépek a TOC alapján külső forrásokból (pl. CDDB , Gracenote ) keresik a metaadatokat .

Digitális audio formátumok, mint például a digitális audio fájlokat túlhaladott zenei formátumok, mint például kazetták és CD-k az 2000-es években. A digitális hangfájlokat több információval lehet ellátni, mint amennyi csak a fájl nevében szerepel. Ezeket a leíró információkat hangcímkének vagy audió metaadatoknak nevezik általában. Számítógépes programok szakosodott hozzáadása vagy módosítása ezt az információt nevezzük tag szerkesztők . A metaadatok felhasználhatók digitális audio fájlok megnevezésére, leírására, katalógusozására és tulajdonjogának vagy szerzői jogainak jelzésére, és jelenléte sokkal könnyebbé teszi egy adott hangfájl csoporton belüli megkeresését, általában a metaadatokat elérő keresőmotor használatával. A különböző digitális hangformátumok kifejlesztésekor megpróbálták szabványosítani a digitális fájlok egy adott helyét, ahol ezeket az információkat tárolni lehet.

Ennek eredményeként szinte minden digitális audio formátum, beleértve az mp3 , broadcast wav és AIFF fájlokat, hasonló szabványosított helyekkel rendelkezik, amelyek metaadatokkal tölthetők fel. A tömörített és tömörítetlen digitális zene metaadatai gyakran kódolva vannak az ID3 címkében. Az olyan gyakori szerkesztők, mint a TagLib, támogatják az MP3, Ogg Vorbis, FLAC, MPC, Speex, WavPack TrueAudio, WAV, AIFF, MP4 és ASF fájlformátumokat.

Felhőalkalmazások

A felhőalapú alkalmazások elérhetőségével, beleértve azokat is, amelyek metaadatokat adnak hozzá a tartalomhoz, a metaadatok egyre inkább elérhetők az interneten.

Adminisztráció és menedzsment

Tárolás

A metaadatok tárolhatók akár belsőleg , ugyanabban a fájlban vagy struktúrában, mint az adatok (ezt beágyazott metaadatoknak is nevezik ), vagy külsőleg , a leírt adatoktól elkülönített fájlban vagy mezőben. Az adattár általában az adatoktól leválasztott metaadatokat tárolja , de kialakítható a beágyazott metaadat -megközelítések támogatására. Mindegyik lehetőségnek vannak előnyei és hátrányai:

  • A belső tárolóeszközök metaadatai mindig az általuk leírt adatok részeként utaznak; így a metaadatok mindig rendelkezésre állnak az adatokkal együtt, és helyben kezelhetők. Ez a módszer redundanciát hoz létre (kizárja a normalizálást), és nem teszi lehetővé a rendszer összes metaadatának egy helyen történő kezelését. Ez vitathatatlanul növeli a következetességet, mivel a metaadatok az adatok megváltoztatásakor azonnal megváltoznak.
  • A külső tároló lehetővé teszi az összes tartalom metaadatainak elhelyezését, például egy adatbázisban, a hatékonyabb keresés és kezelés érdekében. A redundancia elkerülhető a metaadatok szervezésének normalizálásával. Ebben a megközelítésben a metaadatok egyesíthetők a tartalommal, amikor információt továbbítanak, például a Streaming médiában ; vagy hivatkozhat (például webes linkként) az átvitt tartalomból. A lefelé mutató oldalon a metaadatok felosztása az adattartalomból, különösen azokban az önálló fájlokban, amelyek máshol hivatkoznak a forrás metaadataikra, növeli a kettő közötti eltérések lehetőségét, mivel előfordulhat, hogy egyikük változása sem jelenik meg a másikban.

A metaadatok ember által olvasható vagy bináris formában tárolhatók. A metaadatok ember által olvasható formátumban, például XML -ben való tárolása hasznos lehet, mivel a felhasználók speciális eszközök nélkül is megérthetik és szerkeszthetik azokat. A szövegalapú formátumokat azonban ritkán optimalizálják a tárolási kapacitás, a kommunikációs idő vagy a feldolgozási sebesség szempontjából. A bináris metaadat-formátum mindezekben a tekintetben hatékonyságot tesz lehetővé, de speciális szoftverre van szükség a bináris információk ember által olvasható tartalommá alakításához.

Adatbázis-kezelés

Minden relációs adatbázis -rendszer saját mechanizmusokkal rendelkezik a metaadatok tárolására. Példák a relációs adatbázis metaadataira:

  • Az adatbázis összes táblájának táblái, nevük, méretük és soraik az egyes táblázatokban.
  • Az egyes adatbázisok oszloptáblái, milyen táblázatokban használják őket, és az egyes oszlopokban tárolt adatok típusa.

Az adatbázis terminológiájában ezt a metaadat -készletet katalógusnak nevezik . Az SQL szabvány egységes eszközt határoz meg a katalógus elérésére, az úgynevezett információs sémát , de nem minden adatbázis valósítja meg, még akkor sem, ha megvalósítja az SQL szabvány más aspektusait. Az adatbázis-specifikus metaadat-hozzáférési módszerekre példát az Oracle metaadatai című részben talál . A metaadatokhoz programozott hozzáférés lehetséges olyan API -k használatával, mint a JDBC vagy a SchemaCrawler.

A népi kultúrában

A metaadatok fogalmának egyik első szatirikus vizsgálata, ahogy ma értjük, Hal Draper amerikai sci -fi író novellája, az MS Fnd in a Lbry (1961). Itt az egész emberiség tudása egy asztalfiók méretű objektumba sűrűsödik, azonban a metaadatok nagysága (pl. ... katalógus katalógusa, valamint az indexek és a történetek) végül szörnyű, de humoros következményekhez vezet az emberi faj. A történet előfeltételezi a modern következményeket, amelyek miatt a metaadatok fontosabbá válnak, mint a valódi adatok, és az esetleges kockázatokat, mint figyelmeztető történetet.

Lásd még

Hivatkozások

További irodalom

  • Gartner, Richard. 2016. Metaadatok: A tudás formálása az ókortól a szemantikus webig . Springer. ISBN  9783319408910 .
  • Zeng, Marcia és Qin, Jian. 2016. Metaadatok . Facet. ISBN  9781783300525 .

Külső linkek