Pandoc
Qualche tempo fa ho reso pubblico un piccolo tool scritto prima in c#, e poi convertito in python, per convertire una pagina XHTML in un file ConTeXt da usare come base. Come scrissi illo tempore, tale strumento è stato testato in diverse occasioni.
Bene, navigando qua e là per la rete, ho scoperto che c'è chi ha fatto di meglio: un tale John Mac Farlane ha scritto, utilizzando il linguaggio funzionale haskell, Pandoc, ovvero un convertitore universale da formato testuale a formato testuale. Tale strumento è disponibile per Linux, OSX e Windows. Va detto subito: questo tool non converte XHTMLin ConTeXt, ma converte formati testuali quali Markdown (e, in misura minore, LaTeX, HTML, reStructured Text) in una valanga di formati, nella fattispecie:
A questo punto, i miei pochi lettori scuoteranno la testa perplessi chiedendosi: ma che cos'è questo Markdown? Che cos'è il reStructured Text? Rispondo subito: Markdown è, nella sua forma originale, due cose:
Per questo motivo, in maniera indipendente, sono spuntate diverse estensioni al linguaggio, che rispettano in maniera fedele le sue specifiche iniziali e lo estendono, aggiungendoci cose tipo tabelle, liste di definizioni e cose simili.
reStructured Text è, concettualmente, molto simile a Markdown: basilarmente un file di testo con una formattazione molto leggera, anch'esso interpretabile da un essere umano qualsiasi e che può essere convertito in una marea di altri formati (ahimé, niente ConTeXt). Quest'ultimo formato è stato utilizzato come base per la realizzazione di diverse SRD indie: The Shadow of Yesterday, Fate, SOTC, Diaspora partono da un file reStructured Text convertito poi in HTML.
Di più: un flusso di lavoro simile (scrittura del testo in un formato il più scarno possibile seguito poi da una postelaborazione) è seguito anche dallo scrittore di fantascienza inglese Charles Stross, e i vantaggi di tale metodo sono che ci si concentra prima su quello che si scrive, e poi sul suo aspetto. Incidentalmente, il buon Charlie usa reStructured Text...
Un altro vantaggio di questo approccio è che il proprio testo rimarrà interpretabile indipendentemente dalle paturnie delle grandi software house: Microsoft in primis, ma anche Apple et. al. di tanto in tanto si divertono a cambiare il formato dei loro prodotti di elaborazione testo. Provate, utenti di Word2007 ad aprire qualcosa scritto nei primi anni '90 con Word 2...
Un file di testo, invece, rimarrà sempre interpretabile. Se poi gli strumenti di conversione saranno anch'essi aperti, il proprio lavoro elettronico sarà sempre interpretabile e convertibile, indipendentemente dalle politiche delle grandi case produttrici di software.
Dopo questa lunga, ma obbligatoria prefazione, torniamo al nostro strumentino: anche se NON rende obsoleto xhtml2ctx, certamente è molto più versatile, soprattutto alla luce dei motivi espressi di cui sopra. Il sottoscritto ha fatto qualche test qua e là, e c'è da dire che funziona veramente bene. Certo, ci sono conversioni migliori di altre: la conversione in RTF si limita a produrre testo formattato e senza informazioni di stile, mentre la conversione in ODT (Open Office) include anche gli stili specificati, rendendo facile una customizzazione dell'aspetto del testo veloce e puntuale.
Pure la conversione in ConTeXt è buona: certo, il documento risultante è scarno a dire poco, ma sta poi all'autore, o all'impaginatore, sostituire le informazioni stilistiche di base con le proprie.
Per finire, ritengo che pandoc sia uno strumento utilissimo per l'autore indie. L'assenza di distrazioni quali formati tipografici, clipart, wordart e compagnia cantante è un aiuto fondamentale nella fase di scrittura e revisione del testo. Pandoc, così come tanti altri strumenti simili, favorisce un flusso di lavoro di questo tipo:
Bene, navigando qua e là per la rete, ho scoperto che c'è chi ha fatto di meglio: un tale John Mac Farlane ha scritto, utilizzando il linguaggio funzionale haskell, Pandoc, ovvero un convertitore universale da formato testuale a formato testuale. Tale strumento è disponibile per Linux, OSX e Windows. Va detto subito: questo tool non converte XHTMLin ConTeXt, ma converte formati testuali quali Markdown (e, in misura minore, LaTeX, HTML, reStructured Text) in una valanga di formati, nella fattispecie:
- markdown
- reStructuredText
- HTML
- LaTeX
- ConTeXt (il nostro amico!)
- RTF (Word, Open Office)
- DocBook XML
- OpenDocument XML
- ODT (Il formato base di Open Office!)
- GNU Texinfo
- MediaWiki markup (per le pagine di Wikipedia)
- groff man pages
- S5 HTML slide shows.
A questo punto, i miei pochi lettori scuoteranno la testa perplessi chiedendosi: ma che cos'è questo Markdown? Che cos'è il reStructured Text? Rispondo subito: Markdown è, nella sua forma originale, due cose:
- una sintassi, molto semplice da imparare, per scrivere testo formattato e strutturato in un modo che, a differenza di un file HTML, o ConTeXt, o LaTeX può essere letto ed interpretato senza difficoltà da un essere umano qualsiasi.
- un programma che converte un testo in markdown in XHTML.
Per questo motivo, in maniera indipendente, sono spuntate diverse estensioni al linguaggio, che rispettano in maniera fedele le sue specifiche iniziali e lo estendono, aggiungendoci cose tipo tabelle, liste di definizioni e cose simili.
reStructured Text è, concettualmente, molto simile a Markdown: basilarmente un file di testo con una formattazione molto leggera, anch'esso interpretabile da un essere umano qualsiasi e che può essere convertito in una marea di altri formati (ahimé, niente ConTeXt). Quest'ultimo formato è stato utilizzato come base per la realizzazione di diverse SRD indie: The Shadow of Yesterday, Fate, SOTC, Diaspora partono da un file reStructured Text convertito poi in HTML.
Di più: un flusso di lavoro simile (scrittura del testo in un formato il più scarno possibile seguito poi da una postelaborazione) è seguito anche dallo scrittore di fantascienza inglese Charles Stross, e i vantaggi di tale metodo sono che ci si concentra prima su quello che si scrive, e poi sul suo aspetto. Incidentalmente, il buon Charlie usa reStructured Text...
Un altro vantaggio di questo approccio è che il proprio testo rimarrà interpretabile indipendentemente dalle paturnie delle grandi software house: Microsoft in primis, ma anche Apple et. al. di tanto in tanto si divertono a cambiare il formato dei loro prodotti di elaborazione testo. Provate, utenti di Word2007 ad aprire qualcosa scritto nei primi anni '90 con Word 2...
Un file di testo, invece, rimarrà sempre interpretabile. Se poi gli strumenti di conversione saranno anch'essi aperti, il proprio lavoro elettronico sarà sempre interpretabile e convertibile, indipendentemente dalle politiche delle grandi case produttrici di software.
Dopo questa lunga, ma obbligatoria prefazione, torniamo al nostro strumentino: anche se NON rende obsoleto xhtml2ctx, certamente è molto più versatile, soprattutto alla luce dei motivi espressi di cui sopra. Il sottoscritto ha fatto qualche test qua e là, e c'è da dire che funziona veramente bene. Certo, ci sono conversioni migliori di altre: la conversione in RTF si limita a produrre testo formattato e senza informazioni di stile, mentre la conversione in ODT (Open Office) include anche gli stili specificati, rendendo facile una customizzazione dell'aspetto del testo veloce e puntuale.
Pure la conversione in ConTeXt è buona: certo, il documento risultante è scarno a dire poco, ma sta poi all'autore, o all'impaginatore, sostituire le informazioni stilistiche di base con le proprie.
Per finire, ritengo che pandoc sia uno strumento utilissimo per l'autore indie. L'assenza di distrazioni quali formati tipografici, clipart, wordart e compagnia cantante è un aiuto fondamentale nella fase di scrittura e revisione del testo. Pandoc, così come tanti altri strumenti simili, favorisce un flusso di lavoro di questo tipo:
- scrivo il testo, e al limite gli do una struttura (titoli, elenchi, evidenziazioni e testo tabellato)
- in un secondo tempo, lavoro sul suo aspetto.
Commenti
Posta un commento