Metatiedot e-kirjoissa - Julkaise Kaikille Siirry suoraan sisältöön

Metatiedot e-kirjoissa

Digitaaliset julkaisut sisältävät metatietoja. Usein nämä tiedot tallentuvat automaattisesti ohjelmissa tuotantovaiheessa. Esimerkiksi Word-tiedostoon sisältyy automaattisesti tietoa asiakirjan pääkielestä ja tekijästä. Tiedostoihin voidaan myös liittää ulkoisesti kuvaustietoja. Esimerkiksi kirjastot kuvailevat digitaalisia julkaisuja kirjastojärjestelmissä erilaisten kuvailuformaattien avulla. Metatiedot on yleensä tarkoitettu koneluettaviksi, mutta metatiedoissa voidaan myös käyttää vapaan tekstin kenttiä, jotka ovat helpommin ymmärrettävissä.

Tässä osiossa käydään ensin läpi e-kirjojen tiedostoihin sisällytettäviä metatietoja ja sen jälkeen esitellään keinoja kuvailla e-kirjojen saavutettavuusominaisuuksia tuotetiedoissa, joita välitetään kirjojen kanssa. Keskitymme etenkin saavutettavuusominaisuuksia kuvaileviin metatietoihin.

E-kirjatiedostojen sisällä oleva metadata

E-kirjojen sisällä olevaa metadataa voidaan hyödyntää lukuohjelmissa, jotka voivat näyttää metadatan kenttiä käyttäjälle. Tiedostojen metadatasta on hyötyä myös e-kirjojen tallentamisessa: metatieto pysyy tiedostoissa ja on haettavissa vaikka tiedosto siirrettäisiin uuteen talletuspaikkaan.

Ehkä tunnetuin metadatastandardi on Dublin Core, jonka avulla e-kirjoissa ilmoitetaan usein tekijä ja teoksen nimi. Epub 3 -kirjassa pitää olla seuraavat Dublin Core -standardin mukaiset metatiedot: title (teoksen nimi), identifier (yksilöivä tunnus, Suomessa yleensä isbn-numero) ja language (teoksen pääkieli). Myös viime muokkauspäivämäärä on pakollinen kenttä. Nämä metatiedot sijoitetaan content.opf-tiedostoon. Ilman title-, identifier- ja language-tietoja epub 3 ei läpäise validointia. Pakollisten kenttien lisäksi epub-tiedostoissa yleisesti käytettyjä Dublin Core -metatietoja ovat esimerkiksi creator, publisher, date ja rights.

Vaaditut Dublin Core -tiedot esitellään tarkemmin EPUB 3.3 -spesifikaatiossa (englanninkielinen) kohdassa 5.3.3 ja kohdassa 5.5.6.

Schema.org-metatieto kertoo saavutettavuusominaisuuksista

Dublin Coren avulla ei voida kuvailla e-kirjojen saavutettavuusominaisuuksia. Niiden kuvaamisen käytetään schema.org-sanastoa. Alla esitellään tarkemmin EPUB Accessibility 1.1 -määrityksen mukaiset pakolliset ja suositellut schema.org-kentät. Epub-kirjojen saavutettavuutta tarkistava ACE by Daisy -ohjelma tutkii alla esiteltyjen schema.org-kenttien olemassaolon ja antaa varoituksen, jos jokin pakollinen kenttä puuttuu.

Sisällön havaitsemistavoista kertominen

Kentät accessMode ja accessModeSufficient kertovat, miten kirjan sisältö on tuotettu ja miten kirjan sisältöä havaitaan. Kenttien erona on se, että accessMode kertoo, missä kaikissa muodoissa kirjan sisältöä on, kun taas accessModeSufficient kertoo, missä muodossa kaikki kirjan oleellinen sisältö on havaittavissa. (Oleellinen sisältö tarkoittaa sisältöä, joka kirjan ymmärtämisen kannalta pitää havaita. Esimerkiksi koristekuva ei ole oleellista sisältöä.)

Kentät voivat saada yhden tai useita seuraavista arvoista: textual, visual, auditory ja tactile. Arvot visual, auditory ja tactile viittaavat selkeästi aisteihin: visuaalinen havaitaan näön avulla, auditiivinen kuulon ja taktiilinen tunnon avulla. Arvo textual tarkoittaa sitä, että sisältö on tekstiä, johon pääsee ohjelmallisesti käsiksi. Tekstin havaitsemiseen ei tarvita ihmisen näköä.

Kenttä accessMode on pakollinen

Jos e-kirja sisältää vain tekstiä, epub 3 -formaatissa pitää olla seuraava merkintä:
<meta property="schema:accessMode">textual</meta>
Tekstin pitää olla aitoa tekstiä, ei kuvia tekstistä, jotta lukija pääsee tekstiin käsiksi haluamallaan lukutavalla: silmin katsomalla, korvin kuuntelemalla tekstistä puheeksi -synteesin avulla tai sormin tunnustelemalla pistekirjoitusnäyttöä.

Jos e-kirjassa on tekstin lisäksi kuvia tai kuvia tekstistä, merkintä on:
<meta property="schema:accessMode">textual</meta>
<meta property="schema:accessMode">visual</meta>
Huomaa, että jos kuvat ovat koristeellisia ja ne voisi jättää pois, visual-merkintää ei tarvita. Jos e-kirjassa on vain kansikuva ja esimerkiksi kustantamon logo, visual-merkintää ei käytetä.

Jos e-kirjassa on tekstin ja kuvien lisäksi ääntä tai video, jossa on ääntä, tarvitaan kolmas kenttä:
<meta property="schema:accessMode">auditory</meta>.

Kenttä accessModeSufficient on suositeltu

Kenttä accessModeSufficient on tärkeä lukijoille, jotka käyttävät apuvälineitä, kuten ruudunlukuohjelmaa. Kentän avulla kerrotaan, mitä aisteja tarvitaan sisällön havaitsemiseen. Kun kirjassa on kenttä <meta property="schema:accessModeSufficient">textual,visual</meta>, se kertoo, että kirjan sisällössä on tekstin lisäksi visuaalisia osia (kuvia tai kuvia tekstistä) ja sisällön havaitsemiseen käytetään näköä. Jos kirjan kaikki oleelliset kuvat on selostettu esimerkiksi alt-tekstien avulla ja kirjan oleellisen sisällön voi havaita lukemalla, lisätään myös kenttä <meta property="schema:accessModeSufficient">textual</meta>. Tämä textual-arvo ilmaistaan usein käyttäjille ymmärrettävimmin englanniksi screen reader friendly eli suomeksi voisi todeta ”toimii ruudunlukuohjelmilla”.

Kenttien AccessMode ja accessModeSufficient eroja on selostettu tarkemmin englanniksi EPUB Accessibility Techniques 1.1 -dokumentissa kohdissa 3.1 ja 3.2.

Kenttä accessibilityHazard on pakollinen

Tämän kentän avulla lukijaa voidaan varoittaa mahdollisista vaaroista, joita e-kirjan lukemiseen voi liittyä. Jos e-kirjassa olisi esimerkiksi video, jossa on sairauskohtauksen mahdollisesti laukaisevia välkkyviä kohtia, pitäisi tästä ilmoittaa: <meta property="schema:accessibilityHazard">flashing</meta>. Jos video on turvallinen, sen voi ilmoittaa käyttämällä kenttää: <meta property="schema:accessibilityHazard">noFlashingHazard</meta>.

E-kirjoissa on kuitenkin yleensä vain tekstiä ja staattisia kuvia, jolloin lukijalle mahdollisesti fyysisesti vaarallisia asioita ei kirjan sisällössä ole. Tällöin riittää lisätä e-kirjaan yksi kenttä
<meta property="schema:accessibilityHazard">none</meta>.

Kenttä accessibilityFeature on pakollinen

E-kirjan erilaiset saavutettavuusominaisuudet kuvaillaan accessibilityFeature-kentän avulla. Kentälle voidaan antaa useita erilaisia arvoja, jotka esitellään englanninkielisellä Accessible Publishing Knowledge Base -sivustolla. Tässä käydään läpi tärkeimmät epub-kirjoissa olevat saavutettavuusominaisuudet ja niiden arvot.

  • alternativeText: Kun e-kirjan oleellisille kuville on alt-tekstit tai kuvat on selostettu kirjan tekstissä, ilmoita se lukijoille: <meta property="schema:accessibilityFeature">alternativeText</meta>. Kuvien vaihtoehtoisten tekstien olemassaolo on yksi tärkeimmistä tiedoista näkövammaisille lukijoille.
  • displayTransformability: Kun e-kirja on tuotettu siten, että tekstin kokoa, fonttityyppiä tai rivivälistystä on mahdollista muokata lukuohjelmassa, asia ilmoitetaan lukijoille tämän kentän avulla. Huomaa, että epubin tyylit pitää tällöin määritellä suhteellisina kokoina eikä tiukasti tiettynä pikselikokona.
    <meta property="schema:accessibilityFeature">displayTransformability</meta>
  • structuralNavigation: Kun e-kirjan otsikot on merkattu semanttisesti oikein eli html-koodissa on käytetty h1, h2, jne. otsikkoelementtejä, e-kirjassa voi liikkua otsikoiden välillä. Tämä kerrotaan lukijoille:
    <meta property="schema:accessibilityFeature">structuralNavigation</meta>
  • tableOfContents: Tämän kentän avulla ilmoitetaan lukijoille, että e-kirjassa on sisällysluettelo, jonka avulla kirjassa voi liikkua. Sisällysluettelossa pitää olla vähintään pääotsikot.
    <meta property="schema:accessibilityFeature">tableOfContents</meta>
  • pageBreakMarkers: Tätä kenttää käytetään silloin, kun e-kirjaan on merkitty painetun kirjan sivunvaihtokohdat: <meta property="schema:accessibilityFeature">pageBreakMarkers</meta>. Huomaa, että tällöin on syytä antaa metadatassa myös lähdeteoksen tieto: <dc:source id="src">urn:isbn:9789510123456789</dc:source>
    Sivujen merkitsemisestä epubeissa lisätietoja englanniksi Accessible Publishing Knowledge Base -sivulla Page Navigation.
  • readingOrder: Kun e-kirja on tuotettu siten, että osien lukemisjärjestys on looginen, käytetään tätä kenttää. Avustava teknologia hakee lukemisjärjestyksen html-koodeista. Jos tyylien avulla html-elementtien järjestystä muutetaan visuaalisesti, looginen lukemisjärjestys näkyy visuaalisesti, mutta avustava teknologia ei sitä löydä. Tällöin tätä kenttää ei voi käyttää. <meta property="schema:accessibilityFeature">readingOrder</meta>
  • MathML: Tämän kentän avulla ilmoitetaan lukijoille, että e-kirjassa on matemaattiset kaaviot merkattu MathML-merkkausten avulla. <meta property="schema:accessibilityFeature">MathML</meta>

Epub-formaatissa olevassa e-kirjassa pitäisi olla vähintään yksi accessibilityFeature-kenttä. Kannattaa käyttää useita kenttiä, jotka kuvaavat riittävästi e-kirjan saavutettavuusominaisuuksia. Niiden avulla on jälkikäteen helppo selvittää, miten e-kirja on tuotettu, eikä tarvitse erikseen tutkia kirjan koodausta. Esteettömyysdirektiivi edellyttää saavutettavuutta myös e-kirjojen lukuohjelmilta. Kun lukuohjelmien saavutettavuus paranee, lukuohjelmat hyvin todennäköisesti myös välittävät schema.org-kenttien arvoja lukijoille ja lukijat voivat saada arvokasta tietoa kirjan ominaisuuksista.

Kenttä accessibilitySummary on suositeltava

EPUB Accessibility 1.0:n mukaan accessibilitySummary on pakollinen, mutta uudemman 1.1-määritelmän mukaan kenttä on suositeltava. Tämä kenttä eroaa edellä esitellyistä siten, että kentän sisältö on vapaamuotoista tekstiä ja tarkoitettu ihmisten luettavaksi. Suomen- tai ruotsinkielisissä kirjoissa tämän kentän arvo siis annetaan suomeksi tai ruotsiksi.

Tavoitteena on se, että accessibilityFeature-kenttien arvot näytetään e-kirjoja myyvissä verkkokaupoissa ja lukupalveluissa ymmärrettävästi, ja kenttien arvojen avulla voi tehdä hakuja verkkokaupoissa. AccessibilitySummary-kenttä täydentää ja tarkentaa e-kirjan saavutettavuusominaisuuksia, mutta siinä ei toisteta accessibilityFeature-kenttien arvoja. Lisätietoja: Accessible Publishing Knowlegde Base: accessibilitySummary.

Schema.org-metatiedon asettaminen

Keväällä 2024 julkaistussa InDesignin versiossa on mahdollista antaa schema.org-kenttiä. Vanhemmissa InDesign-versioissa se ei ollut mahdollista, joten niillä tuotetuissa epubeissa tietoja on syötettävä käsin content.opf-tiedostoon. Virheiden välttämiseksi teksti kannattaa kopioida jostain valmiista mallista ja muokata sopivaksi. Toinen vaihtoehto on käyttää Ace by DAISY -tarkistusohjelmaa, jossa puuttuvat saavutettavuusmetatiedot voi syöttää epub-tiedostoon.

Esimerkkejä eri tyyppisten e-kirjojen schema.org-kentistä ja niitä vastaavista ONIX-arvoista on Saavutettavan e-kirjan hyvät käytännöt -dokumentissa.

E-kirjoihin liitettävä metadata

Saavutettavat e-kirjat pitäisi tehdä helpommin löydettäviksi verkkokaupoissa ja lukupalveluissa metadatan avulla. Tämä on toteutettavissa kirjojen mukana välitettävien tuotetietojen avulla. ONIX-formaatti on kirja-alan toimijoiden, kustantajien, kirjakauppojen ja kirjastojen, käyttämä formaatti kirjaan liittyvien sähköisten tuotetietojen välittämiseen.

ONIX-koodilistan 196 avulla kuvaillaan saavutettavuusominaisuuksia

ONIX-metatiedon ylläpidosta ja kehittämisestä Suomessa vastaa ONIX-keskus. ONIX-keskus tarjoaa kustantajille tuotetietopalvelun, jonka avulla uusien kirjojen tietoja voi ilmoittaa sekä päivittää muuttuneita tietoja. Kun ONIX-keskuksen tuotetiedossa valitsee tuotemuodoksi digitaalisen aineiston ja tiedostoformaatiksi EPUB tai PDF, on mahdollista syöttää saavutettavuustietoja koodilistan 196 avulla. Listassa 196 on useita eri koodeja. Joihinkin koodeihin pitää liittää sanallinen kuvaus.

Valitettavasti schema.org-kentät ja ONIX 196 listan koodit eivät täysin vastaa toisiaan eikä ainakaan toistaiseksi ole ohjelmia, joiden avulla schema.org-metadatasta voisi luoda automaattisesti ONIX-kuvauksen. W3C ylläpitää luetteloa Schema.org Accessibility Properties Crosswalk, jossa ovat kaikki vastaavuudet. Huomaa, että luettelossa on kerrottu myös listan 81 koodien liittymisestä schema.org-kenttiin.

Lista 196 on laadittu ennen esteettömyysdirektiiviä, joten listassa on koodeja, jotka kuvaavat saavutettavassa e-kirjassa olevia pakollisia ominaisuuksia. Esimerkiksi koodi 22 (Kielet on merkitty) kertoo, että e-kirjassa on pääkielestä eroavien osien kieli määritelty. Jos epub-muotoinen kirja noudattaa EPUB Accessibility 1.0 tai 1.1 -määritelmää, pitää osien kieli olla määritelty eli koodi 03 (EPUB-saavutettavuusmäärittely 1.0 AA) kertoo saman asian. Koska e-kirjojen ostajat eivät todennäköisesti tunne kovin hyvin saavutettavuusmäärittelyjen sisältöä, kannattaa miettiä, mistä koodeista on ostajille hyötyä. Esimerkiksi tieto kielten merkitsemisestä on kiinnostava kielitieteen tai vieraan kielen oppikirjan ostajalle, mutta ei luultavasti kiinnosta dekkarin ostajaa. Kirja-alalla on hyvä käydä keskustelua siitä, mitä ONIX-kenttiä halutaan hyödyntää esimerkiksi verkkokauppojen hauissa.

Seuraavaksi esitellään tärkeimmät schema.org-kenttiä vastaavat listan 196 koodit.

  • ONIX 196, koodi Saavutettavuustietojen yhteenveto (00) tarvitsee koodin lisäksi kuvauksen. Kuvaus on tarkoitettu ihmisten luettavaksi ja annetaan kirjan pääkielellä.
  • ONIX 196, koodi Siirtyminen sisällysluettelon avulla (11). Tämä koodi vastaa accessibilityFeature-kentän arvoa tableOfContents.
  • ONIX 196, koodi Lukemisjärjestys (13) vastaa accessibilityFeature-kentän arvoa readingOrder.
  • ONIX 196, koodi Lyhyet vaihtoehtoiset kuvaukset (14) vastaa accessibilityFeature-kentän arvoa alternativeText. Tätä käytetään, kun kuville on annettu vain ruudunlukuohjelmille välittyvät alt-tekstit kuvien alt-attribuuteissa.
  • ONIX 196, koodi Kattavat vaihtoehtoiset kuvaukset (15) vastaa accessibilityFeature-kentän arvoa longDescription. Tätä koodia käytetään, kun e-kirjassa kuvat on selostettu laajemmin kuin alt-attribuuteissa. Kuvan yhteydessä voi olla linkki erilliseen pidempään kuvaselostukseen tai pidempi selostus on voitu antaa epub-kirjassa vaikka details-elementin avulla. Huomaa, että e-kirjassa voi olla pääosin alt-tekstejä, mutta pidempää selostusta vaativissa kuvissa on erilliset kuvaukset. Pidempiä selostuksia ei tarvitse olla kaikilla kuvilla.
  • ONIX 196, koodi Visuaalisessa muodossa oleva data on saatavilla ei-graafisena (16) vastaa myös accessibilityFeature-kentän arvoa longDescription. Koodia voidaan käyttää etenkin kirjoissa, joissa pylväs-, viiva- tai ympyrädiagrammien esittämä tieto on annettu vaihtoehtoisesti taulukkomuodossa tai tekstinä.
  • ONIX 196, koodi 17 Saavutettava matemaattinen sisältö (17) vastaa accessibilityFeature-kentän arvoa MathML.
  • ONIX 196, koodi Painettua aineistoa vastaava sivunumerointi (19) vastaa accessibilityFeature-kentän arvoa pageBreakMarkers. Huomaa ONIX-koodin ohje: ”Määritä tunniste sivunumeroiden lähteelle käyttämällä elementtiä <RelatedProduct> suhteen tyypin 13 kanssa.”

ONIX-keskuksen tuotetietopalvelussa voi ilmoittaa muitakin hyödyllisiä saavutettavuustietoja. Uusien saavutettaviksi tuotettujen e-kirjojen kohdalla kannattaa ilmoittaa, mitä saavutettavuusmäärittelyä kirja noudattaa. Esimerkiksi epub-kirja voi noudattaa koodia EPUB-saavutettavuusmäärittely 1.0 AA (03) tai EPUB-saavutettavuusmäärittely 1.1 (04). Pdf-muotoinen kirja voi noudattaa PDF/UA-määrittelyä (koodi 05). Lisäksi voidaan kertoa url-osoite, jossa on Kustantajan verkkosivu saavutettavuuden yksityiskohdista (96). Kustantaja voi siis erillisellä verkkosivulla kertoa tarkemmin kirjan saavutettavuusominaisuuksista.

ONIX Koodilista 196:n uusin versio ja suomennos on Editeurin sivulla: ONIX-koodilistat.

Kirjastojen digitaalisten aineistojen kuvailu

Kirjastojen kuvailusanastoja ja -formaatteja kehitetään vastaamaan paremmin tarpeita kuvailla digitaalisten aineistojen saavutettavuusominaisuuksia. MARC 21 -formaatissa on kaksi saavutettavuuskenttää 341 Saavutettavuussisältö ja 532 Huomautus saavutettavuudesta. Näistä on tarkempaa tietoa Kansalliskirjaston MARC 21 -sivustolla.

Sivua on päivitetty viimeksi 17.5.2024.

Takaisin ylös