<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"><head><title>Outils de migration</title><link href="style.css" rel="stylesheet" type="text/css" /><meta content="DocBook XSL Stylesheets V1.73.2" name="generator" /><link rel="start" href="index.html" title="Comprendre DocBook (Guide pratique)" /><link rel="up" href="index.html" title="Comprendre DocBook (Guide pratique)" /><link rel="prev" href="ar01s07.html" title="Quels sont les projets et les acteurs ?" /><link rel="next" href="ar01s09.html" title="Outils d'édition" /></head><body><div class="navheader"><table summary="Navigation header" width="100%"><tr><th align="center" colspan="3">Outils de migration</th></tr><tr><td align="left" width="20%"><a accesskey="p" href="ar01s07.html">Précédent</a> </td><th align="center" width="60%"> </th><td align="right" width="20%"> <a accesskey="n" href="ar01s09.html">Suivant</a></td></tr></table><hr /></div><div class="sect1" lang="fr"><div class="titlepage"><div><div><h2 class="title"><a id="N10239" />Outils de migration</h2></div></div></div><p> Le deuxième plus gros problème de DocBook est l'effort nécessaire pour convertir les anciens balisages de présentation en balisage DocBook. Les êtres humains sont généralement capables de convertir automatiquement la présentation d'un document en une structure logique, parce qu'ils sont, par exemple, capables de distinguer selon le contexte les cas où l'italique est utilisé comme moyen d'accentuation de ceux où il signifie autre chose, comme le fait que la phrase soit en langue étrangère. </p><p> D'une façon ou d'une autre, il est nécessaire rendre explicite ce type de distinctions lors de la conversion de documents vers le format DocBook. Parfois elles sont présentes dans l'ancien balisage mais ce n'est en général pas le cas et l'information de structure manquante doit, soit être déduite par une heuristique intelligente, soit être ajoutée par un être humain. </p><p> Voici un résumé de l'état des outils de conversion à partir de divers autres formats : </p><div class="variablelist"><dl><dt><span class="term">GNU Texinfo</span></dt><dd><p> La <span class="emphasis"><em>Free Software Foundation</em></span> s'est fixé comme politique de permettre d'utiliser DocBook comme format d'échange. Texinfo est suffisamment structuré pour permettre une conversion automatique satisfaisante, et les versions 4.x de <span class="command"><strong>makeinfo</strong></span> proposent une option <code class="option">--docbook</code> qui produit directement du format DocBook. Vous trouverez plus d'information sur la <a class="ulink" href="http://www.gnu.org/directory/texinfo.html" target="_top">page du projet makeinfo</a>. </p></dd><dt><span class="term">POD</span></dt><dd><p> Il existe un module <a class="ulink" href="http://www.cpan.org/modules/by-module/Pod/" target="_top">POD::DocBook</a> qui traduit le balisage POD (<span class="foreignphrase" lang="en"><em class="foreignphrase">Plain Old Documentation</em></span>) en DocBook. Il prétend traduire l'intégralité des balises POD sauf la balise italique L<>. La page de manuel précise également « <span class="quote">Il n'est pas possible d'utiliser de listes imbriquées pour une sortie en DocBook</span> » et fait remarquer que le module a été intensivement testé. </p></dd><dt><span class="term">LaTeX</span></dt><dd><p> LaTeX est (essentiellement) un langage de macros de balisage structurel construit au-dessus de l'outil de mise en forme TeX. Il existe un projet appelé <a class="ulink" href="http://www.lrz-muenchen.de/services/software/sonstiges/tex4ht/mn.html" target="_top">TeX4ht</a> qui (selon l'auteur de PassiveTeX) est capable de produire du code DocBook à partir de LaTeX. </p></dd><dt><span class="term">Pages de manuels et balisages basées sur troff</span></dt><dd><p> On considère généralement qu'il s'agit du problème de conversion le plus important et le plus désagréable. Et en effet le balisage de base de <span class="citerefentry"><span class="refentrytitle">troff</span>(1)</span> possède un niveau de présentation trop bas pour que des outils de conversions puissent apporter quelque aide que ce soit. Cependant la situation s'éclaircit significativement si l'on considère les traductions de documents écrits avec des paquets de macros comme <span class="citerefentry"><span class="refentrytitle">man</span>(7)</span>. Ceux-ci sont suffisamment structurés pour permettre une traduction automatique. </p><p> J'ai moi-même écrit un outil pour ce faire car je n'en trouvé aucun capable de faire proprement le travail (et également parce que le problème est intéressant). Il s'appelle <a class="ulink" href="http://www.catb.org/~esr//doclifter/" target="_top">doclifter</a>. Il convertit au format SGML ou XML DocBook les macros <span class="citerefentry"><span class="refentrytitle">man</span>(7)</span>, <span class="citerefentry"><span class="refentrytitle">mdoc</span>(7)</span>, <span class="citerefentry"><span class="refentrytitle">ms</span>(7)</span> ou <span class="citerefentry"><span class="refentrytitle">me</span>(7)</span>. Consultez la documentation pour plus d'informations. </p></dd></dl></div></div><div class="navfooter"><hr /><table summary="Navigation footer" width="100%"><tr><td align="left" width="40%"><a accesskey="p" href="ar01s07.html">Précédent</a> </td><td align="center" width="20%"> </td><td align="right" width="40%"> <a accesskey="n" href="ar01s09.html">Suivant</a></td></tr><tr><td valign="top" align="left" width="40%">Quels sont les projets et les acteurs ? </td><td align="center" width="20%"><a accesskey="h" href="index.html">Sommaire</a></td><td valign="top" align="right" width="40%"> Outils d'édition</td></tr></table></div></body></html>