"Un peu de pédagogie sur la notion de formats de fichiers." par Yannick Chenevoy

mercredi 26 juillet 2006, par Webmestre

source :

http://yonne.lautre.net/article.php3?id_article=1838

mercredi 26 juillet 2006

Tout d’abord, le format "OpenDocument" (format ODF adopté par OpenOffice, avec sa déclinaison ODT pour le texte) vient d’être accepté officiellement (mai 2006) pour devenir une norme internationale ISO (et aussi une norme OASIS), au même titre que PDF ou HTML (lien).

Pour l’instant (à ma connaissance), seuls les logiciels OpenOffice, NeoOffice, StarOffice, KOffice ainsi que des éditeurs comme IBM, Novell et Sun utilisent et acceptent le format OpenDocument, mais ils vont sans doute faire des petits dans un future proche.

D’après les copains de la liste logiciels libres d’Attac, on peut aussi rajouter Abiword, Gnumeric (tableur) et Writely (le traitement de texte en ligne développé par Google)

En fait, seul Microsoft résiste. ODF est désormais adopté dans de nombreuses administrations : Union européenne, gouvernement fédéral belge, Etat du Massachusetts... (voir http://fr.wikipedia.org/wiki/ODF).

Le format RTF (Rich Text Format) est certainement meilleur pour s’échanger des documents sur internet que le format DOC, susceptible de véhiculer des virus (c’est un format partiellement binaire, qui peut donc facilement masquer des bouts de codes exécutables).

Cependant, RTF n’est pas à ma connaissance une norme internationale reconnue, c’est simplement un format développé par Microsoft (et partiellement documenté) pour l’échange de documents textes. Format qui est imparfaitement reconnu parfois par les traitements de textes concurrents de Word (la preuve avec ce message que je n’ai pas pu ouvrir moi non plus).

Ce problème avec les formats de fichiers, c’est un peu le mythe de la tour de Babel : si on n’a pas le bon logiciel pour lire le bon format, alors le document peut être illisible.

Cela devient problématique lorsque Microsoft change le format de fichier Word (DOC ou RTF) lors des changements de version, ses utilisateurs étant alors prisonniers d’un cercle vicieux qui les contraint à acheter chaque mise à jour, qu’ils désirent changer ou non. Ils pourront même s’apercevoir, dans quelques années, que les documents Word qu’ils rédigent aujourd’hui ne pourront plus être lus avec la version de Word qu’ils utiliseront alors.

C’est encore plus préoccupant si le logiciel responsable de ce format est payant alors que les concurrents en question sont libres et gratuits (ce qui n’est pas forcément la même chose, en anglais, les termes "open" et "free" sont moins ambigus).

Cela devient carrément révoltant lorsque le format en question est protégé par un brevet qui interdit d’en comprendre le fonctionnement (il existent des rapports qui précisent que Microsoft prévoit d’utiliser des extensions XML brevetées pour un futur format Word ; quiconque implémentant un logiciel libre pour lire ces fichiers pourrait être poursuivi pour violation de brevet par Microsoft).

Moi, quand je lit cela, je ne peux m’empêcher de penser à ces agriculteurs poursuivis par Monsanto parce que des graines OGM, protégées par brevets, ont eu le malheur de germer dans leur champ.

Pour ce qui concerne maintenant l’échange de documents via internet, ce genre de problème risque fort de se reproduire, à un rythme croissant, au fur et à mesure du brevetage des formats de fichiers propriétaires. Et aussi, il faut le dire à cause de l’ignorance de la plupart des internautes des enjeux liés aux formats de fichiers (mais surtout aux logiciels à utiliser pour les lire).

Nous devrons alors pour nous lire mutuellement adopter un des deux choix suivant :

1 - On achète tous les produits Microsoft

2 - On se met d’accord sur une norme internationale reconnue pour le format de fichier, et chacun est libre de choisir le logiciel qu’il voudra pour lire ou écrire les documents à s’échanger.

Évidemment, Word ne sais pas lire pour l’instant ce format, c’est alors qu’il faut avoir le courage et la volonté d’effectuer ce geste (prévoir un échauffement de l’index pendant au moins 10 mn auparavant) :

CLIQUER SUR CE LIEN -

http://fr.openoffice.org/

C’est pas plus compliqué que de cliquer sur celui-ci

http://www.adobe.com/fr/lorsqu’il s’agit de lire des fichiers au format PDF.

Certains pourront répondre que c’est trop compliqué, ce sont les mêmes dans le monde agricole qui prétendent qu’il est plus simple d’utiliser des semences génétiquement modifiées.

Petit détail instructif pour conclure.

Les fichiers ODF sont beaucoup moins lourds et sont mieux adaptés pour l’échange de documents, surtout sur des listes de discussions soumises à des limites concernant la taille des pièces jointes.

Exemple, avec ce fichier au format Word
http://www.reseau-ipam.org/IMG/doc/... , son réenregistrement avec OpenOffice sous différents formats donne :

Au format PDF, le fichier fait 338 279 octets (un ordre d’idées : un texte de 338 279 caractères). C’est normal d’avoir un plus gros fichier en PDF car ce format est dérivé du format PostScript, qui permet une description quasi parfaite des pages, préservant ainsi les polices de caractères, les images, les objets graphiques, la mise en page...

Au format DOC, le fichier fait 158 208 octets.

Au format RTF, le fichier fait 132 651 octets

Au format ODT, le fichier fait 47 056 octets : 3 fois moins lourd que les formats Microsoft et c’est normal. Le format ODF (et donc ODT pour sa version texte), c’est une archive compressée (on dit aussi zippée) contenant les données nécessaires au documents (au format XML). Rien de plus transparent, et tout ce qu’il y a de plus normalisé...

Répondre à cet article