L’IA américaine va-t-elle tuer la culture européenne ?
Perdu dans la traduction
Ironiquement, pour être véritablement compétitifs, les LLM européens devront toujours parler couramment l'anglais – qui reste la langue de la plupart des articles scientifiques dans le monde et d'un peu plus de la moitié des pages du Web, selon le cabinet d'enquêtes en ligne W3Techs.
« Il existe un déséquilibre de pouvoir en termes de quantité et de qualité des données de formation : il suffit de regarder la taille de Wikipédia en anglais par rapport à ses versions dans d'autres langues », a déclaré Sebastian Ruder, chercheur scientifique chez Cohere, une société d'IA multilingue basée au Canada.
Certains LLM fabriqués aux États-Unis maîtrisent des langues autres que l'anglais, mais ils n'ont pas toujours les compétences et les nuances nécessaires pour bien servir les utilisateurs locaux.
« Il faut, par exemple, avoir le bon niveau de politesse », a déclaré Ruder. Pensez à apprendre à un chatbot à utiliser le pronom poli «vous » au lieu de l'informel « tu» pour éviter de vexer un utilisateur français âgé.
Pour les chatbots conçus pour interagir dans des conversations complètes avec tout le monde, des citoyens d'un pays aux clients d'une entreprise, cela peut créer des problèmes. Une évaluation de « l'alignement culturel » réalisée en août 2023 par des chercheurs de l'University College de Londres a révélé que les LLM d'OpenAI et de Google étaient en décalage avec les normes culturelles de pays comme la Chine, l'Arabie saoudite et la Slovaquie, tout en réussissant les tests d'adhésion aux mœurs américaines.
À mesure que l’IA s’implante dans tous les aspects de nos sociétés, l’impact de tels conflits culturels pourrait être considérable. Kris Shrishak, chercheur en technologie au Conseil irlandais pour les libertés civiles, a déclaré : « Une entreprise technologique américaine peut former son modèle en lituanien, par exemple, mais cela entraîne des pertes. Donc, il le formait généralement en anglais, puis procédait à quelques ajustements.
La solution, selon Ruder, consiste pour les développeurs européens d’IA à former leurs robots à la fois dans leur langue et en anglais, permettant ainsi au LLM d’exploiter les connaissances codées en anglais lorsqu’il parle sa langue maternelle.