CR de situation - Internet PLUS

From IUCG - Internet Users Contributing Group

Jump to: navigation, search

Je trouve, sur le site de la diversité culturelle du Québec, le texte suivant que je veux conforter, mais aussi commenter, car il ne va pas assez profond dans sa localisation du problème, de la manière dont il se joue et avec qui. Le bien comprendre est nécessaire pour aider l'action que je mène avec un succès encore par trop solitaire, et donc par trop limité, depuis dix ans.

"Les enjeux de la diversité culturelle mondiale peuvent se résumer ainsi : l'évolution du cadre normatif du commerce international, qui forme pour ainsi dire l'ossature de la mondialisation économique, tend de plus en plus à remettre en cause le rôle de soutien que jouent actuellement les États et les gouvernements en matière de culture au profit des populations qu'ils représentent. L'abandon de ce rôle, qui se concrétise actuellement par des politiques culturelles et diverses mesures de soutien à la culture, entraînerait l'application des seules règles du marché au secteur culturel. Cette situation serait synonyme d'une homogénéisation des cultures au profit d'un modèle culturel unique, fondée sur une logique purement économique et commerciale qui exclurait l'expression des cultures « moins rentables » ou ne disposant plus des ressources et des mécanismes de soutien nécessaires à leur expression."

Je suis à 100%d'accord, sauf que l'"évolution du cadre normatif du commerce international" relève mécaniquement d'un processus très simple, très précis, et plus profond. Il est conduit par quelques personnes et pour des motifs intellectuels et économiques bien délimités. Ce mécanisme est celui de l"internationalisation" de l'informatique et plus précisément maintenant de son moyeu qui est l'internet. Depuis de très nombreuses années je m'y oppose pour des raisons de meilleur fonctionnement du réseau international. Nous sommes actuellement sur ce dossier en pleine confrontation technique clé.

"First they ignore you, then they laugh at you, then they fight you, then you win!"
Gandhi.

.

Contents


Les personnes et les intérêts

Il se trouve que les personnes compétentes et influentes sont essentiellement :

  • Harald Alvestrand (Google) : ancien Chair IETF, membre du conseil d'administration d'Unicode et de l'ICANN - auteur des RFC définissant la stratégie linguistique de l'Internet.
http://en.wikipedia.org/wiki/Harald_Tveit_Alvestrand
  • Mark Davis (Google) : Président d'Unicode, auteur des principes de la "globalization" chez IBM (comment réduire la barrière linguistique entre les machines et les clients), auteur des RFC internet sur le filtrage des langues.
http://en.wikipedia.org/wiki/Mark_Davis_(Unicode)
ftp://ftp.software.ibm.com/software/globalization/documents/globalization.pdf
Membres d'Unicode : http://www.unicode.org/consortium/memblogo.html (leaders : Google, Microsoft, Yahoo!, IBM, Oracle).
  • Vint Cerf (Google) : Vice Président et Internet Evangelist de Google, Chair du groupe de travail de l'IETF sur la mise à niveau des RFC sur les noms de domaine internationalisés (WG-IDNABIS).
http://en.wikipedia.org/wiki/Vint_Cerf
  • John Klensin (indépendant) : ancien Chair IAB, ancien liaison IETF/ICANN, auteur de nombreuses RFC, auteur de la RFC 4690 de l'IAB faisant la critique de la solution IDNA actuelle,auteur de plusieurs projets de RFC travaillés par le WG-IDNABIS (leur agencement final n'est pas décidé).
http://en.wikipedia.org/wiki/John_Klensin
  • Patrick Falström (Cisco Suède et beaucoup d'activités) : monsieur discret, créateur d'ENUM et de beaucoup de choses. Rare IETF à participer à l'IGF, auteur du projet de RFC du WG-IDNABIS qui nettoie Unicode pour être effectif comme code supportant les IDNA.

La situation mécanique

La situation est essentiellement mécanique. La technique de la machine, décide de la culture des hommes. La primauté anglo-saxonne en informatique s'y oppose en fait à l'analyse parallèle faite par l'UIT considérée comme partiellement obsolète après avoir prévalu pendant 20 ans.

Deux écoles ont en résulté :

  • l'analyse de la "Série X" qui a une approche déductive qui prévaut par le modèle à sept couches dit "OSI", mais que personne n'approfondit en raison de son degré d'abstraction et d'une épurée de tout exemple. Elle est perçue par l'EIFT comme "ONU" car elle est par essence multilatérale et techniquement universelle (indépendante des langues qu'elle traite à égalité - d'où l'absence d'exemple concret).
  • la pateaugeage (volontaire pour donner la parôle à tous) inductif et pragmatique de l'IETF qui a réussi un prototype qui marche très bien sur quatre couches (donc avec de très gros manques) et qui a conduit à une stratégie très simple "on ne répare par ce qui n'est pas cassé, même s'il y a des rustines et beaucoup de choses en moins, surtout si cela rapporte plus). Elle est conçue, documentée et implémentée en langue anglaise par souci de cohérence et de stabilité.

Mécaniquement, pour l'utilisateur, la très grande différence (outre la sécurité) est l'absence de couche "présentation" dans le monde Internet. Le service de "présentation" c'est précisément le service qui fait que l'utilisateur puisse vivre "son" internet dans la seule et pleine "présentation" de sa langue et non pas dans le filtrage de la présentation ASCII anglaise aménagée par la "globalization" inventée par Mark Davis.

La "globalization" est la possibilité pratique d'étendre l'anglais international par environ 150 langues (146 actuellement) selon quatre idées simples :

  1. il faut que le système en accepte les caractères. C'est l'"internationalization" du médium. Ceci est fait par tout le travail d'Unicode (traduit en ISO 10646)
  2. il faut que les machines en acceptent les mots et les usages. C'est la "localization" qui donne aux machines (par les fichiers "locale"s + traduction l'information nécessaire. Engagée par l'ISO (sur procédure rapide du Danemark) cette "localization" se voulait culturelle. Elle est maintenant conduite (pour ces 146 langues) par le projet CLDR d'Unicode.
  3. il faut un aiguillage (filtrage) correct des flux pour qu'ils soient ou servis par la localization existante, soit conduits vers la localization "la plus proche" (vous parlez breton, je vous répond en français - le plus proche commun étant par défaut l'anglais), soit refusés (apprenez l'anglais, la langue de mon commerce).
    Ceci se fait par les "langtags", un long combat d'Harald Alvestrand. Les tables de ces étiquettes linguistique et leur gestion représente maintenant de très loin la plus grosse base de données du IANA, mais sans processus de mise à jour (des tables et des systèmes utilisateurs) satisfaisants.
    Ceci donne un poids politique important à ses gestionnaires et participe de la googlisation possible de l'Internet, en ce sens qu'une solution élégante aux divers problèmes posés serait l'hébergement du IANA par Google dans le cadre de la réorganisation ISOC/IETF et peut-être ICANN (à la fin du JPA).
  4. il faut que tout cela fonctionne de façon cohérente et partout de la même manière pour être utile. Il faut donc des routines logicielles qui s'en chargent, ce sont les routines ICU de Mark Davis (logiciel libre IBM, passé sous Unicode), qui assurent la reconnaissance des langtags, et la gestion des paramètres linguistique dans la plus part des langages de programmation, à commencer par XML.

L'étalon actuel qui sert à la fois de banc test et de paradigme opérationnel est Google, Mark Davis étant responsable de l'internationalisation dans cette société. La vérification est assurée par Addison Philip, co-auteur des RFC de filtrage linguistique, son équivalent chez Yahoo!

L'opposition à cette prise en main unique des outils d'aide à penser par la seule langue anglaise

L'opposition à une standardisation mécanique ne peut pas être politique, économique, ou sentimentale. Elle ne peut se traduire que par une contre-proposition plus attractive ou moins économiquement ou techniquement dangereuse à tout le monde (les tenants de la première compris, car il faut qu'ils permettent la transition).

La nature de cette contre-proposition est connue de tous. Il "suffit" de mettre l'internet aux normes acceptées de tous. C'est à dire mettre en place un service de "présentation" et l'utiliser pour une véritable multilinguisation, traitant techniquement chaque langue comme l'anglais aujourd'hui - c'est à dire "la localization de la globalization".

Pour ses opposants, il suffit donc de standardiser dans la pratique commune des points anodins (qui seront acceptés sans trop d'opposition) mais qui s'avèreront bloquants. Diverses méthodes ont été tentées depuis dix ans:

  • identification initiale au point techniquement mineur, mais pratiquement bloquant des noms de domaine.
  • refus initial (forcé par le Département d'Etat US) d'en débattre (ICANN)
  • lenteur et orientation du débat IETF qui choisit Unicode tel quel comme support (la plus part des difficultés viennent de ce qu'Unicode n'est pas fait pour une indexation sûre multilinguistique).
  • laxisme des textes qui bloquent les alternatives possibles par leur confusion, n'en permettant pas l'interopérabilité.
  • tentatives de contournement normatif par influence sur l'ISO
  • modification sous la contrainte de la "nécessité" de la bande passante internationalization de l'Internet et précédent du contrôle linguistique par les ingénieurs IETF/Unicode.
  • beaucoup, beaucoup d'ad hominems, les arguments techniques, dit-on, de ceux qui n'en n'ont pas.

C'est parfois homérique, cela demande beaucoup de temps, mais depuis dix ans nous sommes un petit groupe sans coordination réelle (et parfois confronté à des coups tordus impensables) qui nous opposons avec succès à ces tentatives. Au point d'exaspérer nos grands adversaires.

La décision prise par Vint Cerf

Il y a un mois, Vint Cerf a demandé un consensus sur un point de détail apparent (le traitement du caractère arabe TATWEEL dans IDNA). En fait, ce point de détail n'est pas simple. Il est fondamental, car la difficulté résulte du manque de définition concernant la fameuse "présentation" dans l'architecture internet et par là tout ce qu'une telle couche permettra (un multiple bouleversement total de l'Internet, où toutes les données politiques, économiques, stratégiques actuelles sont pratiquement remises à zéro).


Pour faire simple, la _même_ action (interdire au caractère arabe TATWEEL de figurer dans un IDN), selon qu'elle est exécutée du côté de l'Internet ou du côté de l'utilisateur, c'est à dire dans le _même_ programme à la ligne avant, ou à la ligne après la ligne frontière, fait passer, probablement définitivement en raison de sa grande hystérésis, le monde internet (et sans doute le reste du monde) :

  • d'une "présentation" unique c'est-à-dire d'un contexte uniculturel supporté par le pivot anglais ASCII, qui aura été décidée par notre équipe IETF, vérouillant une société fondée sur l'e-commerce anglo-saxon, dans la ligne de l'accord de Tunis qui laisse la gestion du "Legacy Internet" aux Etats-Unis.
  • à un service de "présentation" géré par l'utilisateur, d'une multitude de contextes culturels techniquement égaux qui, choisi par chacun quand il le veut, comme il le veut, respecte les 25.000 entités linguistiques de David Dalby et mon ambition de pouvoir aussi respecter et faciliter l'expression de nos dizaines de milliards d'idiolectes circonstanciels (que l'ordinateur saura bientôt identifier et signer). Nous sommes dans la ligne de l'émergence internet pour une société de l'information qui soit "people centered, à caractère humain, centrada en la persona", comme "nous peuples du monde" l'avons proclamé et voulu à Tunis.

Par ailleurs, si la décision est prise par des ingénieurs et non par des linguistes et des politiques, c'est la primauté donnée à la machine et au standardiseur sur l'Homme, les Etats et les académies.

Enfin, cette décision permet de réduire la bande passante "caractères" de l'Internet global: le code binaire utilisé par Unicode pour le caractère TATWEEL est exclu de l'internet. Toute autre application devra en tenir compte. C'est un formidable outil d'opposition à toute alternative future à Unicode.

En avant dernier, cette décision s'oppose à la lettre même de la Charte du groupe de travail où elle est expressément interdite, sous l'argument d'une prétendue nécessité, qui légitimise d'autres décisions de même ordre, préparées de longue date.

En tout dernier, cette décision remettait en cause le consensus technique en train de se former autour du respect de mon opposition, et la préoccupation concernant les majuscules de langue française qui ne sont pas supportées comme dans les autres écritures, les règles grammaticales anglaises devant prévaloir dans l'univers ASCII.


Vint a donc déclaré que sa position recevait un consensus "overwhelming" bien qu'il soit explicitement et fermement opposé pour des raisons linguistiques par les Membres Iraniens (Persans) de la communauté d'écriture arabe qui doit statuer par consensus. Et pour que cela soit, il m'a banni du groupe de travail.

Cela a provoqué la montée en ligne de deux autres français courtois et distingués qui ont été à leur tour expulsés pour tenir le même raisonnement, et pour prévenir d'autres contestations. Depuis trois semaines le silence prévaut donc au WG-IDNABIS dans l'attente d'un texte de compromis.

Dans de telles circonstances, il revient d'en discuter avec l'"Area Director" et le cas échéant de faire appel à l'IESG. J'avais déjà fait appel de façon technique d'une première prise de position de Vint, afin de clarifier les relations entre l'IETF, l'IAB et les utilisateurs, ce qui a résulté en une initiative commune sous la forme de la liste iucg@ietf.org et du site http://iucg.org que j'anime. Pour justement permettre les contributions des utilisateurs réels techniquement et culturellement compétents, capables par eux-mêmes de modifier leur internet ou son expérience (utilisateurs pilotes).

Il était donc hors de question de faire appel, cela aurait été une perte de temps alors que visiblement nos opposants jouent la montre et la lassitude (depuis huit ans de débats quasi identiques).

Notre changement d'attitude

Nous cherchions à préserver l'unité normative, par l'influence des rédacteurs IETF dont la mission est eux-mêmes "d'influencer ceux qui construisent, utilisent et gèrent l'internet". Notre but était qu'ils écrivent des textes de leur manière, mais qui ne nous soient pas rédhibitoires.

Après avoir été ignorés, et moqués, nous sommes maintenant attaqués. C'est bon signe. Mais nous avons aussi compris qu'il nous faudrait un siècle pour que l'IETF nous suive sur la multilinguisation et la manière d'y parvenir. Nous avons donc décidé de changer notre fusil d'épaule. Nous avons d'abord voulu documenter nous-mêmes ce dont nous avons besoin. Nous avons commencé naturellement par l'adressage sémantique de l'Intersem (l'internet multilingue et sémantique) pour qu'il soit interopérable avec le DNS. Pour pouvoir l'expliquer par un exemple de vie réelle, nous avons aussi créé une association porteuse du projet ".fra", pour la langue française.

Il s'est rapidement avéré que, même si c'était très compréhensible à des francophones ou semi-francophones, réduire notre contribution à cette demande sans en documenter l'énorme contexte "sémiophysique" (René Thom) était totalement inaudible à des anglophones dont la démarche technique est trop différente.

Nous en sommes donc venus à engager la documentation directe de la modification de l'Internet (et de toutes les autres technologies sous ou compatibles TCP/IP) pour supporter l'Intersem, en particulier par une couche présentation. En français et en anglais, comme pour les normes ISO.

Ceci est un travail de synthèse et de simplification important, à rédiger dans un cadre IETF, auquel nous n'étions pas préparés mais que nous espérons terminer (brouillon) cette semaine. Nous aurons ensuite une liste de discussion ouverte à tous : IETF, société civile, économistes, politiques, linguistes, développeurs, etc. Il faudra en effet discuter et expliquer les conséquences de l'apport des "services étendus" (dont celui de présentation) dont notre proposition Internet PLUS (le "plus" qui manque à l'internet, à la télévision, aux mobiles, etc. pour supporter la strate sémantique) permet très facilement ce support à qui le veut (RIEN n'est changé tant au niveau des ordinateurs, des logiciels et de l'Internet - simplement une extension à charger - ... une fois développée).

Ce qui va changer, mais qui est transparent à la technologie, est la langue et les services culturels attachés. C'est la base technique de la capacitation culturelle et linguistique. L'Intersem c'est d'abord un Internet qui pourra techniquement être 100% dans sa langue, sa culture, son éthique ... après il faudra en assurer la gouvernance et l'adminance.

Personal tools