Dare un senso all'EPUB3

Corsi ebook di quintaEPUB3 viene in genere messo in mostra per le sue capacità multimediali, ma l'utilizzo di XHTML5 può introdurre anche nuove strumentazioni per una marcatura semantica del testo digitale. Durante i corsi di formazione mi viene spesso chiesto, ad esempio, come trattare semanticamente le bibliografie che si incontrano nel corpo del testo. Prendendo come campione questo testo a scorrere:

Il nome della rosa è un romanzo scritto da Umberto Eco nel 1980 e pubblicato da Bompiani. L'opera, ambientata sul finire dell'anno 1327, si presenta come il manoscritto del monaco Adso da Melk, che, ormai anziano, mette su carta i fatti vissuti da novizio molti decenni addietro in compagnia del proprio maestro Guglielmo da Baskerville. La narrazione si svolge all'interno di un monastero benedettino dell'Italia settentrionale, ed è suddivisa in sette giornate, scandite dai ritmi della vita monastica.

...come posso fare in modo che le informazioni del libro non siano soltanto delle parole, ma diventino un vero e proprio dato interrogabile da motori di ricerca o linguaggi di interrogazione? Se in ePub2 i marcatori sono relativamente poveri al riguardo (solo il cite per indicare il titolo di un'opera), e si è costretti ad usare tag con classi legate alle scelte del redattore, in XHTML5 possiamo utilizzare una formalizzazione semantica più forte. Come spesso accade non si tratta di strumenti che nascono per fare ebook, anzi, sono legati al web e ai motori di ricerca della rete, ma niente ci impedisce di utilizzarli per impaginare digitale: non è detto che il nostro lavoro non approdi anche sul web per una lettura on-line, e comunque è utile una formalizzazione che uniformi le scelte semantiche del nostro ebook a quelle che potrebbe usare un altro editore. Finalmente editori diversi utilizzeranno lo stesso linguaggio per scrivere le stesse cose.

Forse.

Come spesso accade le cose non sono così pacifiche e su quali strumenti semantici utilizzare il dibattito è particolamente acceso: RDFa, microdata, epub:type... il rischio è quello di finire in un semantic overload.

Vediamo comunque un'ipotesi di come si possa marcare il testo preso in esempio, utilizzando i microdata, legati in questo caso alla codifica di schema.org:

<p epub:type="bibliography" itemscope="itemscope" itemtype="http://schema.org/Book"> <cite itemprop="name">Il nome della rosa</cite> è un romanzo scritto da <span itemprop="author">Umberto Eco</span> nel <date itemprop="datecreated">1980</date> e pubblicato da <span itemprop="publisher">Bompiani</span>. <span itemprop="description">L'opera, ambientata sul finire dell'anno 1327, si presenta come il manoscritto del monaco Adso da Melk, che, ormai anziano, mette su carta i fatti vissuti da novizio molti decenni addietro in compagnia del proprio maestro Guglielmo da Baskerville. La narrazione si svolge all'interno di un monastero benedettino dell'Italia settentrionale, ed è suddivisa in sette giornate, scandite dai ritmi della vita monastica.</span></p>

L'intera zona che contiene l'elemento bibliografico diventa un itemscope, diciamo un focus semantico, il cui vocabolario viene identificato in quello dedicato ai libri ( itemtype="http://schema.org/Book". Potremmo quindi utilizzare una serie di attributi itemprop, il cui valore identifica la semantica del dato: name, author, publisher e così via. Ogni zona diventerà quindi un elemento di una bibliografia costituenda dell'opera digitale che potrà appunto essere ricercata dai motori di ricerca, o dai redattori per creare una bibliografia interattiva da inserire all'interno dell'ebook stesso. Alla fine della composizione del testo digitale si potrà ad esempio chiedere al nostro ebook, gentile ebook, cercami tutti gli itemscope il cui itemtype sia legato al vocabolario dei libri ed fammi un elenco dei titoli, autore, data di pubblicazione, casa editrice, ordinati per data, o per autore o altra chiave di ricerca, e fai sì che toccando il titolo vada a finire nella pagina dove se ne parla. Questa richiesta la dovrò scrivere in un linguaggio formale come XQuery, ma otterrò in pochi secondi quello che ho richiesto.

Tutto questo funziona?

Beh no. Se validate un EPUB3 con i microdata l'EPUB3 non passerà la validazione. Pare infatti che ci siano state un po' di discussioni al riguardo e che questa parte di HTML5 sia rimasta inizialmente fuori dal piatto di EPUB3. Ma quello che non era entrato dalla porta rientra dalla finestra, e le specifiche del febbraio scorso del formato EPUB3.0.1 dichiarano espressamente:

Both [RDFa11] and [Microdata] attributes are now valid for use in XHTML Content Documents. Vocabularies, such as defined at schema.org, can be used with these attributes to enrich content.

Il che siginfica che prima o poi uscirà una nuova versione del validatore epubcheck molto più accondiscendente verso la semantica digitale. Ma questo momento di transizione mostra anche come il mondo dell'editoria digitale sia in perenne, instancabile trasformazione.

 

Questo post è scritto da Fabrizio Venerandi, docente dei corsi ebook di Quintafactory. Scopri i prossimi corsi di giugno e luglio 2014 a Roma.

Un ringraziamento a Matteo Balocco per le discussioni sui microdata e le politiche interne a IDPF al riguardo.

Aggiungi commento


Codice di sicurezza
Aggiorna

joomla template