Viaggio all’interno di un documento ODF

di Giulio Vito de Musso

Pubblicato 6 Novembre 2009
Aggiornato 12 Febbraio 2018 20:41

Avevamo accennato, in precedenza, alla possibilità di poter scompattare i file ODF nei file XML di cui è composto.

Approfondiremo oggi questo interessante aspetto dello standard aperto per l’office automation più utilizzato per comprendere come è fatto all’interno un file ODF.

ODF è un formato aperto, e in quanto tale facilita la modifica dei documenti. A tal scopo, un qualunque file in formato ODF è stato concepito come un archivio di cartelle e file XML facilmente modificabili (seguendo la sintassi dettata dall’OASIS).

Per scompattare i file ODF può essere utilizzato un qualsiasi programma per la compressione e decompressione dei dati (ad esempio 7zip, gestore di archivi freeware, leggero e multipiattaforma).

Una volta decompresso il file ODF potremo navigare all’interno del formato.

Noteremo la presenza dei file XML e di alcune cartelle, contenenti immagini, suoni, riferimenti del programma e parti di documento non esprimibili tramite l’XML.

Alcune immagini e suoni possono non essere presenti nelle cartelle, in quanto le immagini SVG e i suoni SMIL possono essere inglobati all’interno dei file XML.

Ma entriamo nello specifico. I file XML standard contenuti nel formato sono:

  • content.xml: questo file memorizza il contenuto del documento;
  • styles.xml: qui sono contenuti la maggior parte degli stili utilizzati nel documento. Ad esempio, qui potremo trovare gli stili visualizzati nella lista (premere F11 all’interno di OO Writer per vederla);
  • meta.xml: qui sono scritti i metadati del documento, cioè quei dati che affiancano il documento e lo arricchiscono. Ad esempio troveremo la data di creazione, autore, descrizione, titolo, ecc.. Per visionarli in OO, accediamo a Writer e clicchiamo “File -> Proprietà e Strumenti -> Opzioni”;
  • settings.xml: qui sono incluse informazioni circa le impostazioni relative al documento (pagina aperta, posizione del puntatore, fattore di zoom, ecc.).

Un altro file presente è mimetype (senza estensione), che contiene il tipo mime del documento. Infatti ogni formato di ODF ha un proprio tipo mime usato dall’applicazione per riconoscerlo. Ad esempio il tipo mime di un file ODT è “application/vnd.oasis.opendocument.text”.

Le cartelle di base presenti sono META-INF e Thumbnails. META-INF indicizza e descrive i tipi dei file contenuti nel documento, mentre Thumbnails contiene le anteprime delle immagini del documento.

Per chi vuole conoscere la sintassi dei documenti ODF, volesse approfondire o semplicemente è incuriosito dalla modifica di un documento ODF partendo dalle sue componenti di base, può leggere l’esaustivo manuale della versione 1.1 (quella attualmente distribuita) rilasciato dalla OASIS. Il manuale è reperibile in versione HTML, PDF e ODT.