Logiciels et formats de données par Jean-Claude Caty

lundi 6 décembre 2004, par Webmestre

lundi 6 décembre 2004,

source :yonne.lautre.net


Les consommateurs n’ont pas toujours conscience de leurs choix en matière de logiciels. Pourtant de nombreux dangers existent ...

Préambule

La problématique des formats de données en informatique n’est pas uniquement un aspect technique. Elle relève même avant tout d’aspects politiques d’autant plus importants que les données manipulées et stockéees par un ordinateur sont des données publiques (à ne pas confondre avec les données accessibles au public). Cette importance est du reste très bien démontrée sur le site de Thierry Stoehr [1]. D’ailleurs, les éléments principaux de cet article sont fortement inspirés de ce site. Merci à Thierry pour son travail remarquable.

Logiciels et formats de données

Ce n’est pas nouveau, l’informatique produit des données. Citons comme exemple de données un texte produit par un traitement de texte, une feuille de calcul issue d’un tableur, ... Ce processus — banal en apparence — mérite que l’on s’y attarde.

Le plus souvent, ces données sont enregistrées dans un fichier, le processus d’enregistrement est réalisé par un logiciel. Les données du fichier sont inscrites dans un format.

Pour illustrer ce concept de format, imaginons qu’une partie d’un texte doive être soulignée. On peut alors imaginer que le logiciel que l’on utilise décide d’encadrer de codes spéciaux le texte à souligner. Le logiciel connaît ces codes et est donc ensuite capable de décoder et de souligner le texte correspondant.

On voit dans cet exemple que le logiciel et le format sont intimement liés et dépendent étroitement l’un de l’autre. Beaucoup considèrent que cet aspect relève de la cuisine interne du logiciel, de l’éditeur du logiciel et qu’ils n’ont pas la nécessité de s’en mêler, mais n’y a t-il pas danger à réagir ainsi. Peut-on confier ses données à des logiciels, à des formats sans réfléchir ?

Les données que l’on manipule peuvent par ailleurs avoir un caractère public très important comme des données d’état civil gérées par une mairie, les informations d’un acte notarié, ... Comment doivent réagir les mairies, les collectivités et administrations publiques, les notaires ? Notons à ce niveau que les actes notariés sont actuellement conservés sous forme papier.

Pour mieux appréhender ces éléments, il importe de réfléchir sur les caractéristiques des logiciels et des formats de données. Si vous n’êtes pas familiarisé avec ces notions de logiciel et format, n’hésitez pas à consulter l’analogie très intéressante « machine à café » — « format de capsule [2] » sur le site de formats-ouverts

Les logiciels

Dans la jungle des logiciels, il en existe différentes catégories et l’utilisateur lambda a souvent tendance à les confondre. Distinguons ici d’une part les logiciels gratuits des logiciels payants, d’autre part les logiciels libres des logiciels propriétaires.

Logiciels gratuits et logiciels payants

Après écriture par un programmeur, les logiciels sont livrés soit gratuitement, soit contre rémunération. Certains logiciels — les sharewares — sont proposés gratuitement le temps d’être testés par l’utilisateur. A l’issue de la période de test, la licence autorise 2 choix : rémunèrer l’auteur, ou supprimer purement et simplement le logiciel. Ces logiciels ne sont donc pas gratuits.

Logiciels libres et logiciels propriétaires

Autre classification totalement indépendante de la précédente : les logiciels libres et les logiciels propriétaires. Les logiciels libres étant définis de manière très précise par 4 critères, tout logiciel n’y satisfaisant pas est un logiciel propriétaire.

Les 4 critères de définition d’un logiciel libre sont :

- La liberté d’utilisation : Un logiciel libre est utilisé par tous sans restriction d’usage.

- La liberté de modification : Un logiciel libre peut être modifié pour être adapté à son propre usage.

Cette condition implique que le code source du logiciel soit disponible.
- La liberté de copie et diffusion : Un logiciel est librement copiable pour être partagé avec ses voisins, ses amis,... A noter que le logiciel peut être copié sur les multiples ordinateurs d’une même structure.

- La liberté d’amélioration : Les améliorations apportées à un logiciel par toute personne ou structure — grâce à la disposition du code source — doivent être diffusées selon les mêmes libertés. Cela interdit toute appropriation ultérieure.

4 catégories de logiciels

Ces 2 classifications indépendantes permettent de définir 4 catégories résumées dans le tableau suivant :

Logiciel Libre Propriétaire
gratuit Ex :Linux debian freeware
payant Ex : SuSE Linux Commerciaux, shareware

Quelques confusions souvent remarquées :

- Un logiciel libre n’est pas forcément gratuit. Certaines distributions GNU/Linux sont par exemple payantes. Certes le prix est modique au regard de nombreux logiciels propriétaires.

- Un logiciel gratuit n’est pas nécessairement un logiciel libre. Ainsi en est-il des freewares qui ne publient pas leur code source.

Les licences des logiciels propriétaires sont bien plus restrictives que ne l’imaginent beaucoup d’utilisateurs. Tout d’abord, la licence ne donne à l’éditeur qu’une obligation de moyens, pas d’obligation de résultats. Aussi, la société ne mettra t-elle à votre disposition que des moyens pour corriger une éventuelle anomalie. Si la recherche de l’anomalie échoue, vous ne pourrez vous retourner contre l’éditeur compte tenu de l’absence d’obligation de résultats.

De surcroît, ne disposant pas des sources des logiciels, vous ne pourrez faire appel à aucune autre société disposant peut-être de meilleures compétences. De toute façon, même en disposant des sources, cette possibilité vous serait interdite dans la mesure où vous n’avez acheté qu’une licence d’utilisation et non le logiciel lui-même. Vous êtes dans le même cas qu’une personne ayant loué une voiture. Vous pouvez disposer de la voiture selon certaines conditions mais elle ne vous appartient pas.

Dangers relatifs aux logiciels propriétaires

Quelles données dans un format fermé ?

Un logiciel propriétaire ne dit pas ce qu’il enregistre. En effet, le logiciel propriétaire est diffusé en code binaire. Aussi, à moins de parler couramment ce langage, il est extrêmement difficile de savoir ce que fait exactement le logiciel. Un logiciel libre possède l’avantage de publier son code source (langage proche de l’anglais) et il est déjà beaucoup plus facile de comprendre et connaître ses fonctionnalités exactes.

Par ailleurs, le logiciel enregistre les informations manipulées dans un format pouvant être fermé. Quelles données votre logiciel propriétaire enregistre t-il dans un format fermé ? La réponse à cette question est quelquefois difficile. Pour comprendre cette difficulté, l’auteur de cet article vous invite à ouvrir un document issu de Word et au format « .doc » avec un simple éditeur de texte [3] (comme gedit sous GNU/Linux ou notepad sous Windows). Vous comprendrez la difficulté de savoir ce que le logiciel a enregistré.

Particulièrement, pouvez-vous certifier que des données que vous ne voulez pas divulguer sont absentes dans le document généré ?

Vous ne le pouvez pas car — reprenons l’exemple précédent — , Word enregistre des informations supplémentaires dans le document. Ainsi, vous pouvez retrouver du texte effacé dans votre document ! Ce texte est présent et marqué comme effacé. Le logiciel de traitement de texte ne l’affichera pas. Cependant, en ouvrant le document avec un éditeur de texte, il sera visible ! Souhaitez-vous un tel comportement ? N’avez-vous pas supprimé ces informations eu égard à leur caractère personnel ? Ce texte est-il publié sur internet à la disposition de tous ? Des moteurs de recherche ont-ils enregistré et indexé ces informations ?

Les services administratifs utilisent de plus en plus de logiciels commerciaux. De nombreuses informations nominatives doivent rester confidentielles. L’utilisation de logiciels propriétaires ne garantit pas cette confidentialité que tout citoyen est en droit d’attendre de la part des services administratifs de son pays.

La suite bureautique openOffice.org, logiciel libre, enregistre nativement les données dans plusieurs fichiers au format XML [4]. L’ensemble de ces fichiers est ensuite compressé dans un conteneur unique au format openOffice.org (format « sxw » pour le traitement de texte, format « sxc » pour le tableur, ...). Il suffit d’ouvrir ce conteneur avec un utilitaire comme file-roller, ark, winzip, ... pour s’en convaincre.

Terminons ce danger par le coup de l’arroseur arrosé. Une collusion entre la commission européenne et le BSA [5] (dont Microsoft est membre) a été découverte par le biais d’un document Word [6]. Une directive de l’Union Européenne fut rédigée par les lobby du logiciel. L’auteur du document s’avère être membre de BSA. Une cinglante démonstration des propos de Raoul-Marc Jennar dans un article relatif aux lobby à l’oeuvre dans la commission européenne [7].

Le logiciel réalise t-il uniquement ce qui lui est demandé ?

Un logiciel est développé pour réaliser une fonction. Ca, c’est ce qui est annoncé. Mais en êtes-vous bien certain ? Avez-vous les moyens de le vérifier ?

Vous commencez à connaître la chanson. Si l’on dispose du code source du logiciel, n’importe qui, pourvu qu’il dispose de connaissances informatiques suffisantes, peut répondre à cette question. Mieux : si le code source d’un logiciel est disponible, vous êtes quasi certain qu’un informaticien ira regarder le logiciel pour voir comment il fonctionne — par curiosité, pour l’améliorer, ... — et s’il s’y trouve du code qui fait autre chose, il y a des chances pour que l’information remonte. La publication du code source d’un logiciel est donc la meilleure garantie dans ce domaine.

A la lecture de ce texte, j’entends déja des voix : « quelle paranoïa ! ». Aussi conseillerai-je d’utiliser « Windows Media Player », logiciel espion qui enregistre chez Microsoft vos préférences en matière de musique et cinéma [8].

Ce logiciel est réalisé pour lire musique ou vidéo. De quel droit transmet-il vos goûts chez Microsoft ? Cette fonction est-elle documentée ? Car enfin, cette fonction a bien été développée par un programmeur chez Microsoft. Un serveur a bien été mis en place pour recevoir cette information. Quelle est la raison cachée de tout cela ?

Mais, me direz-vous, « Windows media player » est un logiciel propriétaire et il fut bien possible de découvrir cette fonctionnalité sans disposer cependant du code source. Effectivement, une personne plus curieuse que les autres, en analysant le trafic réseau de son ordinateur, a mis en évidence la transmission d’informations suspectes par « Windows media player » . Combien d’autres logiciels propriétaires transmettent ainsi « à l’insu de notre plein gré » des informations personnelles sur nos goûts, notre identité, ...

Et ce n’est pas tout [9] Je laisse à tout individu à la paranoïa plus exacerbée que la mienne une recherche plus approfondie.

Compte tenu de ces faits, il devient même important que les citoyens, gérés informatiquement par les services administratifs de nombreuses collectivités (mairies, impots, ...) exigent la sécurité dans ce domaine. L’adoption des logiciels libres par les services administratifs devient donc une nécessité.

Les formats

Dans la mesure où les logiciels enregistrent et lisent correctement les informations que les utilisateurs leur confient, peu se préoccupent de leur pérennité. Certaines de ces informations, que l’on a tendance à oublier dans le coin d’un disque dur, resteront-elles lisibles plus tard ? Cette question est intimement liée à la nature des formats utilisés pour conserver ces données.

Formats ouverts et formats fermés

La très controversée LEN (« Loi sur l’économie numérique » ) donne une définition des formats ouverts. Le site « formats-ouverts.org » précise cette définition [10].

- des protocoles et des formats de données indépendants d’un logiciel particulier, d’un système d’exploitation ou d’une société.

- des spécifications techniques documentées, publiées, non payantes, sans brevet dessus, sans royalties dessus.

Il faudra probablement que la jurisprudence fasse son oeuvre pour affiner et confirmer ou non l’analyse ci-dessus.

Comme nous l’avons vu précédemment, données et logiciels sont indissociables. Cependant, lorsque le format des données est connu, publié, il devient possible d’écrire plus d’un logiciel pour manipuler, visualiser ces données. Ainsi, le format pdf — format libre — peut-il être affiché par plusieurs logiciels : acrobat reader sous windows et sous Linux, xpdf sous Linux. un document pdf peut également être fabriqué par de nombreux autres logiciels : Acrobat writer, LaTeX, openOffice.org et bien d’autres. Cela est rendu possible car la société Adobe, créatrice du format pdf en a publié les spécifications.

A contrario, le format Word, format fermé par excellence ne peut complètement être affiché ou écrit par des logiciels concurrents. Certains, comme OpenOffice.org semblent capables de le faire. Cependant, ces capacités sont le fruit du travail considérable de personnes qui ont tenté de comprendre les coulisses du format. Elles n’y sont cependant parvenues qu’à concurrence de 90% environ et il reste toujours l’incertitude de ne pouvoir complètement afficher ou fabriquer du format Word, les spécifications restant un secret de Microsoft.

Dangers relatifs aux formats propriétaires.

Vous ne possédez pas le logiciel permettant la gestion des données transmises [11]

Vous venez de recevoir par courriel des informations demandées auprès d’un service public. Puis, en cherchant à l’afficher sur l’écran de votre ordinateur, pas moyen de l’ouvrir. Quel est le problème ?

Tout d’abord, les informations transmises furent élaborées par un logiciel fonctionnant sous un système d’exploitation. Par malchance, votre ordinateur est équipé d’un autre système d’exploitation pour lequel le logiciel n’existe pas. Pire, votre machine n’accepte pas le système d’exploitation requis. Faut-il se résoudre à acheter un autre ordinateur, le système d’exploitation et le logiciel simplement pour pouvoir exploiter ces informations ?

Pour un utilisateur placé dans ce contexte, l’agression est manifeste. Aussi, dans la foulée de Richard Stallman, nous devons refuser les documents qui nous sont envoyés dans des formats fermés [12] et exiger des formats ouverts lisibles sur toute plate-forme. En échange, transmettez vos propres documents dans des formats ouverts. N’hésitez pas à utiliser ce texte pour justifier de votre position.

L’une des applications les plus répandue est le traitement de texte. Il existe une suite bureautique libre maintes fois évoquée ici — openOffice.org — disponible sous de nombreux systèmes d’exploitation : Windows, Linux, MacOS X, ... N’hésitez donc pas à télécharger [13], à la récupérer dans une revue vendue avec CD, voire à demander à un ami cette suite bureautique. La licence de cette suite bureautique le permet et il ne s’agit pas de piratage !

Vous disposez d’un logiciel plus ancien que la version des données.

Autre problème plus pernicieux : vous recevez un document, vous disposez du logiciel permettant de l’ouvrir et ... rien à faire, le logiciel refuse. Motif : le document reçu a été élaboré avec la toute dernière version de votre logiciel fétiche mais propriétaire. Malheureusement, vous ne disposez pas de cette toute dernière version et son achat représente une somme conséquente inacceptable pour votre bourse. La course à la dernière version est réservée à une classe sociale dont vous ne faites pas partie. Tant pis pour vous !

Une version d’un logiciel est abandonnée.

Vous l’avez remarqué, vos logiciels évoluent et vous êtes régulièrement sollicité pour passer à la version suivante. Très rapidement, les versions qui commencent à dater ne sont plus supportées. Des anomalies logicielles peuvent subsister et ne seront jamais corrigées. Comme les sources de ces logiciels ne sont pas disponibles, vous ne pouvez faire corriger ces anomalies, ni par une autre société, ni par un informaticien que vous auriez embauché. Comme cela fut précisé plus haut, cette possibilité est de toute façon interdite par la licence d’utilisation.

Un format est purement et simplement abandonné.

Ces versions successives des logiciels que vous utilisez prennent en compte de nouvelles fonctionnalités, lesquelles se traduisent par une évolution du format. Très rapidement, de la même manière que les anciennes versions logicielles sont abandonnées, les anciens formats subissent le même sort. Si vous n’avez pas évolué parallèllement aux différentes versions logicielles, vous risquez de ne plus pouvoir les actualiser. Les informations sont les éléments les plus précieux d’un particulier, d’une entreprise, d’une administration. Les coûts de mise à jour peuvent devenir prohibitifs si ces informations sont enregistrées dans un format fermé. La garantie d’un format ouvert est celle de pouvoir relire ces données, au besoin en développant un nouveau logiciel de mise à niveau. Cette garantie est refusée lorsque ces informations sont dépendantes d’un format fermé.

Ces problèmes peuvent être particulièrement cruciaux pour les services publics gérant des informations importantes. Ironisons un peu : cela n’est jamais arrivé [14].

Le logiciel est abandonné.

Les « contraintes » économiques du moment sont telles que le particulier, la petite entreprise et même l’administration pèsent peu face aux volontés du marché. Aussi, lorsqu’un logiciel n’est par exemple plus rentable, l’éditeur peut décider unilatéralement d’arrêter ce produit. Les fichiers dans un format fermé gérés par ce produit se retrouvent orphelins.

L’éditeur du logiciel et du format disparaît.

Plus grave, le logiciel n’est pas seul succeptible de disparition. A l’heure où des multinationales comme Enron, Worldcom, Parmalat ne sont pas à l’abri de faillites, rien n’indique que l’éditeur du logiciel ne disparaîtra pas lui aussi. Même Microsoft n’est pas à l’abri [15]. Si l’éditeur disparaît, qu’adviendra t-il de vos données ? Les spécifications du format fermé de vos documents disparaissent dans le même élan. Que chacun se débrouille ensuite pour récupérer ce qu’il peut.

Exemples, conseils, idées recues.

Le but de ce document n’est pas de fournir un catalogue de référence. Bien des sites, à commencer par formats-ouverts.org suivent l’actualité bien mieux que ne peut le faire ce document. Citons toutefois quelques exemples.

Exemples de formats ouverts, formats fermés.

Le format flash, souvent utilisé n’est pas complètement libre. Des spécifications existent mais sont incomplètes. On peut préférer SVG, format ouvert basé sur XML.

Le trop fameux format mp3 n’est pas ouvert à cause de brevets logiciels déposés. Là aussi, l’alternative existe et est meilleure. Préférez lui le format « ogg vorbis » [16]. Il offre une meilleure compression pour un meilleur rendu sonore. Par ailleurs, des baladeurs ogg vorbis existent [17].

La musique est d’ailleurs le théatre de batailles rangées pour imposer des formats fermés. Les enjeux sont considérables dans la mesure où l’objectif inavoué est tout simplement la privatisation des services publics dont la culture au travers des accords de l’OMC [18] (notamment l’AGCS [19]) Quelques liens pour mieux comprendre les enjeux [20] [21]

Le téléphone portable est également concerné [22]

Terminons ce panorama décousu en évoquant le cas d’internet explorer. Combien de fois ai-je entendu dire que les logiciels libres n’étaient pas à la hauteur d’internet explorer. Tordons tout de suite le cou à cette opinion. IE ne respecte pas intégralement les normes du W3C [23], contrairement aux logiciels libres comme mozilla ou firefox. Parallèlement, Microsoft fournit des outils pour publier sur internet, outils favorisant les extensions hors norme d’IE. La faute est ensuite rejetée sur les navigateurs libres incapables d’afficher correctement ... des formats fermés.

Dorénavant, faites vous plaisir. Lorsque vous rencontrez un site « optimisé pour internet explorer », sachez qu’il revendique — sans forcément s’en rendre compte — le non respect des normes ouvertes au profit d’un monde fermé. N’hésitez pas à provoquer son webmaster.

Prolongements

Utiliser des logiciels et formats libres est l’affaire de tous.

L’administration et l’europe ont des discours contradictoires. Un temps poussées par les lobbys, elles seront pour les brevets logiciels générateurs « d’enfermements ». Dans d’autres décisions, elles demanderont des formats ouverts [24]

L’information et la conduite de chacun d’entre nous sont probablement l’un des meilleurs gages d’évolution vers un monde plus ouvert. En son temps, Pythagore a souhaité un monde fermé en demandant à ses étudiants de ne pas divulguer son théorème. Fort heureusement, les mathématiques sont restées libres.

Les logiciels libres et leurs formats ouverts peuvent nous montrer la voie vers un autre monde possible, [25], monde basé sur la coopération et l’intégration de chacun et non sur la compétition et le rejet de tous ceux qui n’ont pas les capacités de s’aligner sur le meilleur.

[1] formats-ouverts.org

[2] Prisonnier d’une capsule

[3] Informations invisibles

[4] XML

[5] BSA : Business Software Alliance

[6] Collusion

[7] Lobby

[8] Player espion

[9] Autre espion

[10] Définition

[11] RMLL

[12] Refusons Word

[13] openOffice

[14] Abandon

[15] CrimeAuSoft

[16] Musique libre

[17] Baladeur Ogg

[18] OMC : Organisation Mondiale du Commerce

[19] AGCS

[20] Enjeu1

[21] Enjeu2

[22] Telephone

[23] W3C : World Wide Web Consortium

[24] Voeu1 ; Voeu2

[25] Possible

Répondre à cet article