Faire face au plagiat dans un contexte numérique

Outil de détection de plagiat proposé par Open AI

L'irruption très remarquée de ChatGPT à la fin de l'année 2022 a jeté une nouvelle lumière sur un problème très ancien: le plagiat. Si l'utilisation d'un tel outil dans le cadre scolaire ouvre une multitude de possibilités qui peuvent être enthousiasmantes, il est évident qu'il soulève de sérieux problèmes d'intégrité. Au-delà du développement très rapide des intelligences artificielles génératives, ces dernières années ont vu le développement de divers outils facilitant le plagiat et sa dissimulation. Plus globalement, on peut faire le constat que le contexte numérique brouille parfois les pistes dans ce domaine, tant pour les élèves que pour les enseignant·es. Ce document vise à faire le point sur l'état de la question et à esquisser quelques pistes d'action.

Version 1 - février 2023

1. Un concept à définir

Dans le contexte scolaire, le plagiat est une forme de fraude. Or, tout le monde n’a pas la même compréhension de ce qu’est le plagiat. Pour certain·es, seule la restitution « mot à mot » d’une source que l’on omet de mentionner tombe dans cette catégorie ; pour d’autres, la définition sera nettement plus inclusive. Un cadre clair est défini par la jurisprudence et par un certain nombre de documents de référence pour les travaux de fin d'études. Relevons notamment le guide du DIP sur la rédaction des travaux personnels d’approfondissement ou les travaux interdisciplinaires centrés sur les projets, ou encore l'Aide-mémoire Ethique/Plagiat de la Commission suisse de maturité. Ce dernier spécifie que "les travaux de maturité commandés à des tiers (ghostwriters) ou élaborés à l'aide de programmes d'intelligence artificielle, mais présentés comme étant les siens, sont également considérés comme du plagiat.

Deux critères déterminants en ressortent :

► Présenter le travail d’autrui comme son propre travail

Par exemple, faire écrire son travail par quelqu’un d’autre, faire écrire (ou réécrire) son travail par une intelligence artificielle, acheter un travail sur Internet, etc.

► Faire une mauvaise utilisation des sources

Par exemple, reprendre un texte mot à mot (avec ou sans guillemets) sans en indiquer la source, paraphraser un document, emprunter une ou plusieurs idées à une source sans la mentionner, utiliser la traduction d’un texte sans en indiquer la source, utiliser une source en renvoyant à une autre source que celle réellement utilisée, etc.

Dans un contexte numérique en ébullition, les règlements et autres documents cadres précisent toujours que la liste des pratiques frauduleuses n’est pas exhaustive.

Par contre, l’intentionnalité n’est pas considérée comme un critère déterminant, dans la mesure où une erreur involontaire ou une maladresse devrait entraîner la même sanction qu’une fraude volontaire.

Bien entendu, même en se basant sur une définition claire du plagiat, certains cas limites sont inévitables. C’est notamment le cas des informations dites de « notoriété publique » qui dépendent fortement de la culture générale de chacun·e. Une enseignante d’histoire pourra évoquer de nombreux faits historiques de mémoire et sans indiquer de sources, alors que ses élèves pourront difficilement l’imiter. Il n’est évidemment pas question de demander le référencement de chaque information de sens commun ; le bon sens doit donc toujours prévaloir dans ce domaine.

2. Les outils de détection du plagiat et leurs limites

Avec l’accès généralisé à Internet, il est devenu très facile, et donc très tentant, pour les élèves de plagier. En réaction, l’utilisation d’outils numériques de détection du plagiat tels que Compilatio s’est généralisée, au degré secondaire comme au tertiaire. Les enseignant·es ont accès à Compilatio tout au long de l'année via le portail eduge.ch et peuvent tester n'importe quel travail rendu sous forme numérique. Cet outil est aussi utilisé systématiquement pour les travaux de fin d'études des différentes filières.

Compilatio détecte très bien tout ce qui relève du «copier-coller» à partir de sources en ligne. Il établit, sur cette base, un score global exprimé en pour-cent et un rapport plus détaillé, dans lequel les passages concernés sont mis en regard des sources identifiées.

Toutefois, l'expérience montre qu'il est hasardeux de se fier trop aveuglément au score fourni par Compilatio. D’une part, les faux positifs sont relativement fréquents. D'autre part, il n'est pas très difficile d'échapper à la vigilance de cet outil en ayant recours à diverses stratégies. Des services en ligne souvent gratuits proposent de reformuler, de résumer, de paraphraser et bien sûr de traduire n'importe quel texte: article académique trouvé sur un portail comme Google Scholar ou Cairn, travail «emprunté» à des tiers, etc. Cette vidéo donne une idée de ce qu'il est possible de faire. Certains sites proposent même de tester si le résultat passe la rampe des outils de détection.

Il n'est donc pas possible de se reposer uniquement sur une approche quantitative définie par un score chiffré. La vérification doit être accompagnée d'une approche qualitative à travers l’analyse plus précise des rapports produits, par exemple en comparant les notes en bas de page aux sources identifiées par Compilatio. Bien évidemment, le suivi des élèves et des travaux par les enseignant·es dans la durée va jouer un rôle déterminant pour prévenir et détecter les formes plus insidieuses de plagiat.

3. L’effet ChatGPT

Savoir s’il est possible de détecter le plagiat commis à l’aide de ChatGPT est une question qui aujourd’hui agite beaucoup le monde de l’enseignement secondaire et universitaire. Le succès médiatique dont nous avons été témoins ces derniers mois occulte sans doute le fait qu’il s’agit d’un cas parmi beaucoup d’autres, présents et à venir.

Vu la rapidité avec laquelle ce domaine évolue, la prudence est de mise. A l’heure où ces lignes sont rédigées, voici néanmoins ce qu’il est possible d’affirmer.

►Détecter les textes produits par ChatGPT et d’autres outils recourant à l’intelligence artificielle est un enjeu capital

Ceci signifie que de très nombreux acteurs y travaillent actuellement. La difficulté technique est importante, dans la mesure où ChatGPT, comme d'autres IA génératives, produit des textes originaux. Il n'est donc pas suffisant de les comparer à l'ensemble des textes disponibles en ligne, à la recherche de similitudes. Les outils actuellement disponibles, comme GPTzero, Plag ou encore Copyleaks sont habituellement payants au-delà des versions d'essai.

► La réponse pourrait venir de l’analyse stylométrique

La stylométrie est l’analyse statistique du style des textes, utilisée pour en identifier les auteurs. En février 2022, cette approche a notamment permis à la société Orphanalytics d'identifier qui se cachait derrière Qanon, mouvance conspirationniste d'extrême-droite venue des États-Unis. Cette technique n'est pas nouvelle et le développement extrêmement rapide de l'Intelligence artificielle auquel nous assistons est de nature à la démocratiser

Il est néanmoins plus important que jamais de sensibiliser les élèves au plagiat et de développer des approches préventives

A l'heure qu'il est, la meilleure stratégie pour se prémunir contre le plagiat chez les élèves consiste à éviter d'évaluer uniquement la version finale d'un travail écrit qui aurait été réalisé à domicile. Il est recommandé de renforcer l'accompagnement et le suivi de l'évolution des travaux.

4. Prévenir le plagiat par la pédagogie

La plupart du temps, le corps enseignant part du principe que les élèves plagient pour avoir une meilleure note ou pour s’économiser du travail dans le cadre scolaire. Selon Martine Peters, professeure à l’Université du Québec en Outaouais et directrice de la recherche du Groupe de recherche sur l’intégrité académique (GRIA), les élèves plagient aussi par manque de connaissances. Ces connaissances sont de quatre ordres :

  1. Compétences informationnelles: les élèves ont des difficultés à mener des recherches bibliographiques efficaces.
  2. Compétences rédactionnelles: les élèves ne savent pas toujours, lors de la rédaction elle-même, citer ou paraphraser adéquatement leurs sources.
  3. Compétences de référencement documentaire: les élèves ont de la peine à référencer correctement les sources utilisées (notes en bas de page, bibliographie).
  4. Connaissances relatives au plagiat lui-même : bien souvent, les élèves ne sont pas suffisamment au clair sur ce qu’est le plagiat exactement.

Selon elle, pour lutter efficacement contre le plagiat, il faudrait donc renforcer les compétences des élèves dans ces quatre domaines en proposant des activités de prévention en classe. Dans cette optique-là, il faudrait mobiliser des enseignant·es de plusieurs disciplines pour accompagner les élèves dans l’acquisition progressive et méthodique de ces compétences par le biais d’activités spécifiques. Les bibliothécaires scolaires, qui proposent d’ores et déjà des ateliers de compétences informationnelles aux élèves, ont également un rôle clé à jouer.  Bien entendu, le fait d’apprendre à utiliser des outils de gestion des données bibliographiques, tels que Zotero ou ZoteroBib, peut être très formateur également dans le cadre des travaux de fin d’études.

5. Des sanctions par degrés de gravité

Une telle approche pourrait se doubler d’une réflexion sur les sanctions à appliquer. Comme évoqué plus haut, le plagiat est considéré comme une forme de fraude dans le cadre scolaire. De ce fait, les sanctions prévues sont lourdes et peuvent aller du 1 à l’annulation pure et simple d’un travail de fin d’études, repoussant d’une année l’obtention du diplôme convoité. Le corps enseignant et les directions d’établissement peuvent donc, dans certains cas, être réticents à sanctionner le plagiat, ce qui donne souvent lieu à des incompréhensions.

Une piste intéressante consisterait à s’inspirer de certaines institutions, comme l’UNIL, qui ont choisi de sanctionner les problèmes de plagiat en définissant divers degrés de gravité. Dans le secondaire II, on pourrait tout à fait imaginer une approche qui tiendrait compte de certains critères au moment de poser une sanction:

  • Dans quel degré scolaire se trouve l’élève ?
  • L’élève a-t-il essayé de signaler son emprunt, même maladroitement ? Ou, au contraire, y a-t-il tentative de dissimulation ?
  • Quelle est la proportion de plagiat présente dans le texte ?
  • L’élève a-t-il a déjà été épinglé pour plagiat, dans le même cours ou un autre cours, auparavant?

Le simple fait de  poser ces questions permettrait de mieux cerner où se situe le problème, de mieux communiquer avec l’élève et de s’inscrire dans une logique pédagogique quand cela se justifie. En première année, un·e élève peut en effet ne pas bien comprendre ce qu’on attend d’elle ou de lui en termes de référencement, alors qu’un·e élève de troisième année qui récidive après avoir été sanctionné·e pour plagiat par le passé n’a aucune excuse. Les sanctions s’inscrivent ainsi dans une logique pédagogique et progressive qui permet de préparer adéquatement les élèves aux exigences du degré tertiaire.

Ressources complémentaires