Les IA qui apprennent un peu comme des élèves

Andrej Karpathy (1) a publié il y a quelques mois une longue vidéo (3 heures 30 !) sur le fonctionnement des modèles de langage tels que chatGPT (LLM : large language model). Au cours de cette vidéo, il utilise une analogie, que je trouve parlante, sur les différents types d’apprentissage de ces modèles : apprendre pour une IA, ce serait un peu comme apprendre pour un élève :

1) Lire le cours
C’est la première phase : le pré-entraînement. L’IA “lit” des tonnes de textes (livres, sites universitaires, encyclopédies, etc.). Elle apprend à reconnaître des structures, des phrases, des concepts. Comme un élève qui lit son manuel pour se familiariser avec les bases. A cette étape, elle ne fait qu’ “ingurgiter” l’information lue.
Bien sûr, analogie oblige, ce vocabulaire est très anthropomorphique et il serait plus correct de dire qu’à cette étape, on cherche un programme capable de prédire le mot suivant lorsqu’on lui donne un début de texte, ce qui nécessite d’encoder des régularités statistiques dans les structures, les phrases, les concepts. J’ai fait une animation pour bien comprendre ce qui se passe dans cette phase de “pre-training”, vous la trouverez ici : https://espritcritique.fbfb.eu/fonctionnementLLM/
A l’issue de cette étape, un modèle de langage est presque inutilisable. Il a ingurgité les données mais ne saurait pas les “communiquer”. Par exemple, il risque de prédire que le texte qui vient à la suite d’une question est une autre question car, dans ses données d’entrainement, les questions viennent souvent par listes. Il faut donc passer à la deuxième étape.

Lire la suite

Quand les IA génératives sont-elles utiles ? (P versus NP ?!)

Les IA génératives sont impressionnantes, mais on sent que leur utilité varie selon les contextes. Une première idée serait de ne les utiliser que dans les domaines dans lesquels on est expert. Mais il me semble que, plus précisément, les IA  génératives sont utiles dans les situations où vérifier est plus simple que produire.

Écrire un texte peut prendre des heures, mais repérer une incohérence ou une faute de style se fait souvent en quelques secondes. De même, générer un code informatique complexe est une tâche ardue, mais tester s’il fonctionne est souvent immédiat; Dans les situations où il y a une telle asymétrie, les IA peuvent proposer une solution rapide, et l’on tranche en un instant si c’est correct et pertinent ou non.

Cela signifierait que les IA ne sont pas utiles à tous pour les même taches. A titre personnel, je les utilise énormément pour coder (il faudra d’ailleurs que je vous en parle: la possibilité de créer en quelques heures des activités numériques pour les élèves me semble un changement potentiellement profond dans l’enseignement !). Pour cet article, créer une image d’illustration aurait pu être un véritable casse-tête, mais vérifier que l’image générée par chatGPT convient – d’après le prompt: “Génère une image qui montre un robot qui donne une copie à un humain qui semble sur le point de la vérifier” – est d’une simplicité enfantine (j’en profite pour créditer l’image!). Les IA génératives sont également très efficaces pour la génération d’idées, toujours suivant la même règle: c’est généralement facile d’évaluer la pertinence et l’intérêt des idées présentées, mais difficile de les avoir.

Peut être que le principe “utilisez des IA génératives dans les cas où vérifier est plus simple que produire” pourrait aider nos élèves à faire un meilleur usage des IA ? Ce n’est qu’une hypothèse, à discuter et tester !

Post-scriptum :
Nos lecteurs informaticiens trouveront probablement que cela rappelle le problème ouvert “P = NP ?”, et si vous trouvez cela intrigant, je vous recommande cette vidéo de sciences étonnantes:

Les jeunes, leurs smartphones, les médias: JAMES vous dit tout

Les usages des jeunes en matière de médias et de numérique font l’objet d’une attention soutenue, c’est un euphémisme. Pour qui s’intéresse à cette vaste et complexe question, l’étude JAMES (pour Jeunes Activités Médias – Enquête Suisse) constitue une source de choix. Tous les deux ans depuis 2010, celle-ci cartographie les habitudes des 12 à 19 ans dans les trois régions linguistiques de la Suisse. Commanditée par un grand opérateur de télécommunications, elle est réalisée par une équipe de la School of Applied Psychology de l’Université de Zurich sur la base d’un échantillon de 1183 personnes.

JAMES mesure non seulement les usages (utilisation du téléphone portable, réseaux sociaux, « consommation » d’information et de médias en général, jeux vidéos, messagerie, …), mais aussi l’accès aux services (abonnements, services de streaming, …) et aux équipements, en relation avec différentes variables comme l’âge, le genre, la région linguistique, le lieu d’habitation (ville/campagne), l’origine et le statut socioéconomique de la famille. Pour ce qui est du smartphone, par exemple, les personnes interrogées ont dû indiquer non seulement la durée d’utilisation, mais aussi les fonctions principales de cet appareil dans leurs pratiques quotidiennes, ou encore les applications les plus fréquemment utilisées. Des aspects moins directement liés aux médias et au numérique sont également traités, à travers une série de questions sur les loisirs en général, ce qui offre une intéressante mise en perspective. Les risques associés au numérique, notamment le (cyber)harcèlement, sont également abordés.

JAMES 2024 : l’IA arrive de manière rapide et massive

Les résultats de JAMES 2024 sont disponible depuis quelques semaines. La dernière étude ayant été menée en 2022, il s’agit de la première édition à aborder les outils d’intelligence artificielle. Les chiffres confirment que les jeunes Suisses et Suissesses ne font pas exception : comparativement à d’autres services en ligne, les outils d’intelligence artificielle ont été adoptés rapidement et massivement. 71% des jeunes ont expérimenté ChatGPT ou un autre outil d’IA et 34% des jeunes l’utilisent au moins une fois par semaine (p. 75). La question de la source d’information de prédilection constitue un enjeu majeur. Relevons que les 18-19 ans s’informent plus fréquemment en recourant à Wikipedia (34% au moins une fois par semaine, p. 41) qu’aux applications d’IA (27%). Dans ce domaine, la part du lion revient aux moteurs de recherche : 86% des jeunes (tous âges confondus) les utilisent tous les jours ou plusieurs fois par semaine dans le but de s’informer. Ce pourcentage s’élève à 57% pour les réseaux sociaux, 25% pour Wikipedia et à 22% pour les applications d’IA.

Lire la suite

ChatGPT et l’IA générative, deux ans après

Deux ans après la sortie mondiale de ChatGPT, le 30 novembre 2022, le paysage numérique ainsi que les pratiques qui lui sont liées ont énormément évolué. Petit tour d’horizon des changements passés et présents.

Les outils

Dans un premier temps, ChatGPT était sur toutes les lèvres et le grand public découvrait avec stupeur (parfois accompagnée de vertiges existentiels ou professionnels) le potentiel énorme des LLM (large language models), ces IA génératives capables de générer à peu près n’importe quel type de texte de manière convaincante.

Lire la suite

IA et fausses informations

On savait que l’arrivée de chatGPT venait avec un risque de voir pulluler de fausses informations, bien rédigées et plus difficiles à “débunker”. Articles, podcasts, vidéos, on a l’impression qu’aucun média n’est épargné ! Voici quelques exemples :

Face à la difficulté d’évaluer la qualité d’une information, il apparaît de plus en plus urgent de former nos élèves à l’esprit critique. Il est essentiel que tous prennent conscience des biais inhérents à la cognition humaine et soient informés des moyens permettant de dépasser ces travers. Ce n’est qu’en prenant connaissance de la manière dont se construit une connaissance de manière fiable et robuste que les jeunes pourront porter un regard sceptique sur les informations auxquelles ils sont exposés.
Les études qui mesurent le développement de l’esprit critique chez les étudiants sont claires : en parler dans son cours ne suffit pas. Des progrès n’ont lieu que si l’on propose des cours spécifiquement dédiés à l’esprit critique, comprenant des contenus théoriques mais aussi des exercices visant à transférer les apprentissages académiques à des situations réelles (source: https://www.oecd-ilibrary.org/education/does-higher-education-teach-students-to-think-critically_cc9fa6aa-en ).

 

Image générée par DALL-E le 5 novembre 2024

Différents LLM pour différents usages

OpenAI fait (à nouveau !) l’actualité cette semaine avec son service chatGPT Search et un mode vocal disponible sur les ordinateurs. On en oublierait qu’il existe d’autres modèles de langage et qu’ils peuvent être tout à fait intéressants, selon vos besoins.

Voici un tableau de quelques services qui me semblent particulièrement intéressants. Si vous utilisez régulièrement chatGPT, je vous encourage à essayer ces alternatives. Elles peuvent toutes être essayées gratuitement, avec un nombre de requêtes maximal différent selon les plateformes.

Nom Entreprise Spécificité
ChatGPT OpenAI Capacités conversationnelles avancées et génération de texte polyvalente.

Pour les mêmes usages, il existe d’autres services: Claude d’Anthropic, Bard de Google,

Perplexity Perplexity AI Moteur de recherche AI fournissant des réponses directes avec des informations sourcées
Consensus.app Consensus Recherche et synthèse d’articles scientifiques pour des réponses basées sur des preuves.
Typeset.io SciSpace Axé sur l’aide à la compréhension de documents scientifiques
HuggingChat Hugging Face Supporte plusieurs LLM open-source et offre une variété de tâches NLP
Copilot Microsoft Intégration poussée dans l’environnement Microsoft et génération de code

 

Par ailleurs, les modèles de langages utilisés par chatGPT sont parmi les plus “gros” et donc les plus gourmands en énergie. Pour des conversations simples, vous pourriez préférer des modèles plus sobres.

Pour vous faire une idée, n’hésitez pas à tester le site: https://www.comparia.beta.gouv.fr/, proposé par le gouvernement français: il permet de proposer une requête et de comparer les réponses de deux LLMs. Sans qu’on sache de qui vient chaque réponse, on vote pour la meilleure. Puis on nous dévoile qui était derrière chaque réponse et les caractéristiques (nombre de paramètres, type de licence) ainsi que la “dépense” en termes énergétiques.

Une mise en garde avant de clore ce court article :  toutes ces IA produisent un contenu dont la fiabilité n’est pas garantie. Vérifiez toujours (souvent plus facile à dire qu’à faire !)

 

 

 

 

Crédits image: canva+IA

 

Musique et IA

Les progrès des IAs génératrices dans le domaine de la musique sont impressionnants ! Cela repose des questions qu’on avait déjà à l’esprit avec la génération de textes et d’images : peut-on parler de plagiat des morceaux utilisés pour l’entraînement ? Est-ce comparable au processus de création humain qui suppose aussi qu’on s’inspire de l’existant ? Quelle place trouveront les artistes dans un environnement où chacune et chacun peut générer des chansons à son goût ?

Lire la suite

Peut-on encore reconnaître des vidéos fake ?

Open AI (l’entreprise qui a mis au point notamment ChatGPT et DALL-E) a annoncé en février 2024 la sortie de “Sora“. Sora est une intelligence artificielle permettant la génération de vidéos à partir de prompts. Pour l’instant, elle n’est pas disponible au public mais elle pose à nouveau la question des deepfakes.

Dans une vidéo récente (avril 2024),  Defakator propose un panorama de l’état actuel des deepfakes:
– techniques actuelles: de la synchronisation des lèvres avec clonage de la voix, aux vidéos générées en passant par le  “face swapping”,
– état de la réglementation : l’Union Européenne a produit un  Artificial Intellience Act qui exige par exemple des IAs qu’elles soient sûres, transparentes, non discriminantes,
– quelques propositions pour nous aider à y voir plus clair: remonter à la source (la réclamer!), repérer des aberrations sur les vidéos générées.

La vidéo comprend de nombreux exemples et des exercices pratiques où serez mis à l’épreuve face à des vidéos fake.

Elle est longue (50 minutes) mais ça vaut la peine de suivre l’état de l’art sur les deep fakes car, comme le dit Defakator: “nos outils évoluent plus vite que nos humanités”.

Lire la suite

ChatGPT ne fait-il que deviner le prochain mot ?

AUTOCOMPLETION

Lorsqu’on présente l’agent conversationnel chatGPT, on compare son fonctionnement à celui d’une application de messagerie qui devine le mot le plus approprié pour compléter la phrase que l’on est en train d’écrire. Or, une courte expérience suffira à nous faire comprendre que la faculté d’autocomplétion de chatGPT est très différente de celle que l’on observe lorsqu’on tape une recherche dans Google ou dans son logiciel de messagerie, des outils qui utilisent également des techniques d’intelligence artificielle.

Lire la suite

Les autres progrès de l’IA

Les progrès spectaculaires des “LLM” (large language model) sont sur le devant de la scène. Dans d’autres domaines, les progrès de l’intelligence artificielle sont également impressionnants et méritent qu’on y prête attention!

En particulier, notons les annonces récentes de Google:

GNoME (Graph Networks for Materials Exploration), annonce du 29 novembre 2023 : cette innovation de DeepMind est particulièrement significative. En découvrant 2,2 millions de nouveaux matériaux, dont 380 000 sont stables, GNoME ouvre la porte à d’innombrables avancées technologiques. La création de nouveaux matériaux est essentielle dans des domaines tels que les semi-conducteurs, les batteries de nouvelle génération et les énergies renouvelables. Google estime que cette percée équivaut à 800 ans de recherche cumulée. Parmi ces matériaux, certains présentent un potentiel révolutionnaire pour des applications telles que les superordinateurs et les batteries avancées pour véhicules électriques, soulignant l’impact profond de l’IA sur notre capacité à innover et à transformer notre monde technologique. DeepMind partage ces découvertes avec la communauté scientifique, démontrant ainsi leur engagement à faire progresser la recherche globale dans ce domaine.

Lire la suite

République et canton de Genève | DIP connexion