Sur le monde selon Google Traduction

J’entends beaucoup parler de « Big Data ». Une expression très bête pour dire que des organisations se retrouvent pourvues de volumes de données considérables.

On pense évidemment à Google, mais il y en a beaucoup d’autres. Et pas seulement les géants du numérique, ces « big four » qu’il faut parait-il appeler les GAFA — Google, Apple, Facebook, Amazon — comme il y a aussi les PIIGS (Portugal Ireland Italy Greece Spain) et les BRICS (Brazil Russia India China SouthAfrica). Va pour GAFA.

Le plus intéressant n’est pas comment ces données sont acquises, stockées et gérées, mais comment les organisations sont supposées en tirer partie. Ces immenses volumes de données sont supposés parler. Elles sont supposées avoir de la valeur. Permettre le développement d’applications « révolutionnaires ».

Prenons Google Traduction.

Il parait que Google Translation est un moteur de traduction « révolutionnaire » parce qu’il ne s’appuie pas, comme ses prédécesseurs, sur l’utilisation de règles et algorithmes toujours plus fins et compliqués, mais sur l’exploitation d’immenses volumes de traduction déjà faites, dûment pompées sur le Web. Autrement dit, ce n’est plus un système conçu pour appliquer une expertise, mais pour imiter une pratique. Chercher le pratique la plus fréquente, la plus populaire et l’imiter.

Je crois que c’est une énorme changement, disons de paradigme, ou de méthode.

Intuitivement, je trouve cette « nouvelle » approche intellectuellement paresseuse. Je suis peut-être vieux jeu, mais je vais essayer d’illustrer ce point de vue intuitif.

Premier point : c’est une extension du principe du sondage, du concours de popularité.

Ça me rappelle le joker « L’avis du public » dans le jeu télévisé « Qui veut gagner du pognon ? ». Ou le principe même du jeu télévisé débile « Une Famille en Or » : les candidats, face à une question donnée, ne sont pas là pour deviner la bonne réponse, mais pour deviner la réponse donnée par une majorité de gens, interrogés par sondage. Pour ce que je m’en souviens, l’animateur jadis daigne rarement, une fois la partie terminée, indiquer aux participants et aux téléspectateurs, même pour l’anecdote, la bonne réponse. La bonne réponse ne compte pas, ce qui compte c’est la réponse donnée au sondage.

J’ai vu souvent vu, en entreprise, comment l’imitation servile du chef conduit à généraliser son style, ses tics, ses discours, mais aussi ses fautes de syntaxe, ses tics de langage, ses erreurs de traduction. Par exemple, dans un environnement dit international, j’ai vu comment, à partir du moment où un chef français s’est mis à dire « ça fait du sens » en français, tout son entourage français a adopté cette traduction très discutable de « it makes sense ». Il faut certes reconnaître que « c’est pratique ! » Et peut-être que cette facilité s’est généralisée. Et si elle est populaire (en jargon marketing, on dira « virale »), Google Traduction va l’adopter. Test rapide : non, Google Traduction traduit encore « it makes sense » par « il est logique ». Mais ce n’était qu’un exemple.

Mais qu’est-ce qui définit une langue ? Spontanément, je répondrais que c’est le dictionnaire, la grammaire, le Bescherelle, le Harraps, etc. Je suis vieux jeu, vous dis-je ! Ces référentiels définissent le sens et l’usage, ainsi que les moyens de traduire d’une langue à l’autre. Mais on peut aussi considérer que, ce qui définit une langue vivante, c’est avant tout la pratique, comment les gens s’en servent, et parfois comment les gens la massacrent — et tôt ou tard dictionnaire, grammaire et autres dinosaures seront bien forcés de suivre, ou de disparaître. Idem pour les traductions.

De ce point de vue, Google Traduction serait-il juste une accélération du sens de l’Histoire, qu’on l’aime ou pas ?

Deuxième point : c’est une généralisation du principe d’approximation.

Pendant mes études dites scientifiques il y a une vingtaine d’années, face à des systèmes d’équations, notamment différentielles, bien compliqués. Deux écoles s’opposaient. Les uns ne voyaient de salut que dans une résolution formelle, il faut trouver une résolution, il y en a forcément une, etc. Les autres se contentaient du recours à un modèle numérique approximatif, se reposant sur la « force brute » de la puissance de calcul pour arriver à un résultat approximatif mais suffisant. On pourrait nommer ces deux écoles : les « puristes » contre les « pragmatiques »… ou les « formels » contre les « numériques ».

Je me demande s’il reste encore des « puristes » ou des « formels ». La puissance de calcul est devenue tellement bon marché, omniprésente. Je ne sais pas comment font les chercheurs d’aujourd’hui, mais je dois des enfants d’aujourd’hui avoir besoin de leur calculatrice même pour les opérations arithmétiques les plus triviales. Et j’imagine que les enseignants ont encore plus de mal qu’il y a 20 ou 30 ans à les convaincre de la nécessité d’apprendre les tables d’addition et de multiplication. De la même manière, combien d’enseignants de langues étrangères se prennent dans la figure l’arrogance d’adolescents équipés de smartphones sur le mode « je m’en fous de ce que vous dites, pour traduire j’ai mon jouet, j’ai pas besoin d’apprendre » ?

Bref, la force brute de la puissance de calcul encourage le recours aux approximations, et décourage la réflexion formelle.

Troisième point : ça nécessite une connexion.

Google Traduction ne peut pas fonctionner « hors-ligne », pas simplement parce qu’elle est hébergée sur un serveur Web, mais parce qu’elle s’appuie sur l’accès aux volumes de données invraisemblables de Google. Je suis peut-être mal informé, mais je ne pense pas que Google envisage de fournir une version « hors ligne ». Mais là aussi, il y a de moins en moins d’applications conçues pour fonctionner proprement sans connexion à la maison-mère.

Il y a beaucoup de conséquences inattendues d’un fonctionnement applicatif exclusivement « en-ligne ». On peut pas s’en servir si le réseau est cassé, ou dans un lieu non desservi par le réseau. On ne peut pas en garder une copie de réserve. On ne peut pas comparer le résultat donné par des versions successives de la chose — comme on peut comparer un Harraps de 1990 et un Harraps de 2010. La Chose n’a pas d’Histoire.

Je garde pour un autre billet la question de l’objectivité, dans la foulée du précédent billet sur le thème « Objectivité et informatique ».

Bonne soirée.

Publicités
Cet article, publié dans big data, est tagué , , , , , , , , , , , . Ajoutez ce permalien à vos favoris.

3 commentaires pour Sur le monde selon Google Traduction

  1. Lisande dit :

    « Ça tome sous le sens » : autre expression peut-être plus française celle-ci.

    « La chose n’a pas d’histoire » en fin d’article. Frisson: réminiscence de 1984…

  2. La Chose n’a pas d’Histoire, avec des majuscules, s’il vous plait. Ça fait frissonner ? C’est fait exprès.

Tous les commentaires seront les bienvenus.

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s