Sophie

Sophie

distrib > * > 2010.0 > * > by-pkgid > a412ceb851151854794ced2a242192bb > files > 884

howto-html-fr-20080722-1mdv2010.0.noarch.rpm

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"><head><title>Outils de migration</title><link href="style.css" rel="stylesheet" type="text/css" /><meta content="DocBook XSL Stylesheets V1.73.2" name="generator" /><link rel="start" href="index.html" title="Comprendre DocBook (Guide pratique)" /><link rel="up" href="index.html" title="Comprendre DocBook (Guide pratique)" /><link rel="prev" href="ar01s07.html" title="Quels sont les projets et les acteurs ?" /><link rel="next" href="ar01s09.html" title="Outils d'édition" /></head><body><div class="navheader"><table summary="Navigation header" width="100%"><tr><th align="center" colspan="3">Outils de migration</th></tr><tr><td align="left" width="20%"><a accesskey="p" href="ar01s07.html">Précédent</a> </td><th align="center" width="60%"> </th><td align="right" width="20%"> <a accesskey="n" href="ar01s09.html">Suivant</a></td></tr></table><hr /></div><div class="sect1" lang="fr"><div class="titlepage"><div><div><h2 class="title"><a id="N10239" />Outils de migration</h2></div></div></div><p>

Le deuxième plus gros problème de DocBook est l'effort nécessaire pour 
convertir les anciens balisages de présentation en balisage DocBook. Les 
êtres humains sont généralement capables de convertir automatiquement la 
présentation d'un document en une structure logique, parce qu'ils sont, 
par exemple, capables de distinguer selon le contexte les cas où 
l'italique est utilisé comme moyen d'accentuation de ceux où il signifie 
autre chose, comme le fait que la phrase soit en langue étrangère.

</p><p>

D'une façon ou d'une autre, il est nécessaire rendre explicite ce type 
de distinctions lors de la conversion de documents vers le format 
DocBook. Parfois elles sont présentes dans l'ancien balisage mais ce 
n'est en général pas le cas et l'information de structure manquante 
doit, soit être déduite par une heuristique intelligente, soit être 
ajoutée par un être humain.

</p><p>

Voici un résumé de l'état des outils de conversion à partir de divers 
autres formats :

</p><div class="variablelist"><dl><dt><span class="term">GNU Texinfo</span></dt><dd><p>

La <span class="emphasis"><em>Free Software Foundation</em></span> s'est fixé 
comme politique de permettre d'utiliser DocBook comme format d'échange. 
Texinfo est suffisamment structuré pour permettre une conversion 
automatique satisfaisante, et les versions 4.x de 
<span class="command"><strong>makeinfo</strong></span> proposent une option 
<code class="option">--docbook</code> qui produit directement du format DocBook. 
Vous trouverez plus d'information sur la <a class="ulink" href="http://www.gnu.org/directory/texinfo.html" target="_top">page du projet 
makeinfo</a>.

</p></dd><dt><span class="term">POD</span></dt><dd><p>

Il existe un module <a class="ulink" href="http://www.cpan.org/modules/by-module/Pod/" target="_top">POD::DocBook</a> 
qui traduit le balisage POD (<span class="foreignphrase" lang="en"><em class="foreignphrase">Plain Old 
Documentation</em></span>) en DocBook. Il prétend traduire 
l'intégralité des balises POD sauf la balise italique L&lt;&gt;. La page 
de manuel précise également « <span class="quote">Il n'est pas possible d'utiliser de 
listes imbriquées pour une sortie en DocBook</span> » et fait remarquer 
que le module a été intensivement testé.

</p></dd><dt><span class="term">LaTeX</span></dt><dd><p>

LaTeX est (essentiellement) un langage de macros de balisage structurel 
construit au-dessus de l'outil de mise en forme TeX. Il existe un projet 
appelé <a class="ulink" href="http://www.lrz-muenchen.de/services/software/sonstiges/tex4ht/mn.html" target="_top">TeX4ht</a> 
qui (selon l'auteur de PassiveTeX) est capable de produire du code 
DocBook à partir de LaTeX.

</p></dd><dt><span class="term">Pages de manuels et balisages basées sur troff</span></dt><dd><p>

On considère généralement qu'il s'agit du problème de conversion le plus 
important et le plus désagréable. Et en effet le balisage de base de 

<span class="citerefentry"><span class="refentrytitle">troff</span>(1)</span> 

possède un niveau de présentation trop bas pour que des outils de 
conversions puissent apporter quelque aide que ce soit. Cependant la 
situation s'éclaircit significativement si l'on considère les 
traductions de documents écrits avec des paquets de macros comme

<span class="citerefentry"><span class="refentrytitle">man</span>(7)</span>. 

Ceux-ci sont suffisamment structurés pour permettre une traduction 
automatique.

</p><p>

J'ai moi-même écrit un outil pour ce faire car je n'en trouvé aucun 
capable de faire proprement le travail (et également parce que le 
problème est intéressant). Il s'appelle <a class="ulink" href="http://www.catb.org/~esr//doclifter/" target="_top">doclifter</a>. Il convertit au format SGML 
ou XML DocBook les macros 

<span class="citerefentry"><span class="refentrytitle">man</span>(7)</span>, 

<span class="citerefentry"><span class="refentrytitle">mdoc</span>(7)</span>, 

<span class="citerefentry"><span class="refentrytitle">ms</span>(7)</span> 

ou 

<span class="citerefentry"><span class="refentrytitle">me</span>(7)</span>. 

Consultez la documentation pour plus d'informations.

</p></dd></dl></div></div><div class="navfooter"><hr /><table summary="Navigation footer" width="100%"><tr><td align="left" width="40%"><a accesskey="p" href="ar01s07.html">Précédent</a> </td><td align="center" width="20%"> </td><td align="right" width="40%"> <a accesskey="n" href="ar01s09.html">Suivant</a></td></tr><tr><td valign="top" align="left" width="40%">Quels sont les projets et les acteurs ? </td><td align="center" width="20%"><a accesskey="h" href="index.html">Sommaire</a></td><td valign="top" align="right" width="40%"> Outils d'édition</td></tr></table></div></body></html>