[1] Nul ne connaît exactement les grandes mutations qui vont se produire en matière de détections automatisées des similarités et des plagiats, alors même que notre université s’apprête, à l’instar de certaines de ses homologues européennes, à se doter de procédures et de logiciels spécialisés. Les grandes sociétés productrices de moteurs de recherche (Google, Yahoo!…) sont très bien placées pour créer rapidement des outils de détection des similarités très performants. Il ne serait pas étonnant qu’elles offrent ou vendent bientôt ce service, dès qu’elles sentiront que les institutions universitaires sont mobilisées.
[2] Les grands éditeurs scientifiques, les archives électroniques, ou les universités qui mettent leur production scientifique en ligne n’ont guère intérêt à ce que leurs documents soient plagiés. Cependant, si elles y réfléchissent, aucune revue scientifique, par exemple, n’a encore annoncé que tous les articles qui lui sont soumis sont évalués par un logiciel de détection des similarités. Pourtant, il ne se passe plus un mois sans qu’un tel cas de plagiat impliquant une revue scientifique ne soit soumis à notre analyse. Tout porte à croire que d’ici peu de temps la réaction va se produire. Or, dès que les archives des revues scientifiques seront accessibles à l’analyse de tels logiciels, il est facile d’imaginer le nombre de cas qui vont subitement surgir ou ressurgir. Nul ne sera à l’abri d’une indélicatesse qu’il aurait commise dans le passé. Vraisemblablement, ceci va se produire d’ici à cinq ou dix ans, ou beaucoup moins.
«Our journal editors frequently ask us how we can support them by using software to detect plagiarism. We take their concerns regarding plagiarism issues very seriously, and we would like to address this need, but it is important to point out that simple or imminent solutions do not exist. We are currently investigating new ways of detecting plagiarism and are exploring the effectiveness of plagiarism-detection software. For example, we are one of the first participants in the CrossCheck pilot, as described below.»
Site Web de l’éditeur Elsevier - http://www.elsevier.com/wps/find/editorsinfo.editors/plagdetect. Consulté le 04.04.2008.
[3] Nos institutions universitaires pourraient donc développer d’ores et déjà des stratégies proactives de recherche de plagiat ou fournir des services de détection de plagiat. En s’associant à d’autres établissements par la participation à des logiciels «open source», en établissant des chartes entre bibliothèques et facultés, pour la détection et la dénonciation du plagiat, nos institutions se prémuniraient des risques de débordement futurs. Certains logiciels constituent leurs propres bases de données en indexant des sites Internet, des documents qu’ils trouvent sur Internet, ou qui sont déposés par les utilisateurs. C’est ce qu’il sera souhaitable de faire avec les documents placés à la bibliothèque ou dans l’archive documentaire de l’université (travaux d’étudiants, mémoires, thèses…).
[4] Bien entendu, toutes les mesures qui seront prises ne pourront éviter aux véritables fraudeurs de se faufiler dans les interstices du système de protection de l’éthique et de la déontologie en matière de production de connaissance. Ainsi, les logiciels actuels de détection ne peuvent retrouver que les documents en accès public. Ces logiciels n’ont pas accès aux sites protégés tels qu’Oboulo.com. Pour retrouver les textes issus de documents dont l’accès est payant, les éditeurs de logiciels anti-plagiat devraient établir des partenariats spécifiques avec les distributeurs de documents payants. Pour l’anecdote, signalons qu’en 2004, le directeur d’un de ces sites célèbres pour vendre en ligne des travaux, nous a envoyé un e-mail pour se plaindre d’avoir été inscrit sur le site responsable sous la rubrique «Sites aidant les étudiants à la fraude» , et nous avons été menacés de procès pour diffamation! Par e-mail, nous leur avons alors proposé que tous leurs documents soient accessibles à un logiciel de type Turnitin ou Compilatio. Nous n’avons plus jamais entendu parler d’eux. Par contre, ils ont établi une charte de «qualité» garantissant aux acheteurs qu’ils avaient soumis tous les documents mis en vente… à un logiciel de détection de plagiat.
[5] C’est donc à une toute autre
échelle qu’il convient de poser le problème de la détection
automatisée ou semi-automatisée des similarités. Dans
les chapitres précédents, nous avons montré que le contrôle
du plagiat est un problème de positionnement individuel et institutionnel
face à la connaissance et à notre rôle de pédagogues,
de chercheurs et de formateurs. Nous conclurons ici en proposant que l’installation
d’un système de détection des similarités soit
pensée en termes de système d’information global de l’institution,
et peut-être plus particulièrement en termes de nouveau service
d’information documentaire. Les quelques points mentionnés ici
ne visent qu’à fournir des pistes de réflexion pour une
intégration dans le SI de l’université. Mais, tant que
les décisions qu’appellent les six chapitres de ce document n’ont
pas été prises, nous considérons qu’il serait illusoire
d’aller plus avant dans la proposition d’une organisation idéalisée.
| Nous recommandons
|
Ottenstein, K. J. (1976) An algorithmic approach to the detection and prevention of plagiarism. ACM SIGCSE Bulletin, Volume 8, Issue 4 (December 1976), pp. 30 – 41.
Berghel, H. L. et Sallach, D. L. (1984) Measurements of program similarity in identical task environments. ACM SIGPLAN Notices, Volume 19, Issue 8 (August 1984), pp. 65 – 76.
Engels, S., Lakshmanan, V. et Craig, M. (2007). Plagiarism detection using feature-based neural networks. In ACM SIGCSE '07: Proceedings of the 38th SIGCSE technical symposium on Computer science education.
White, D., Joy, M. (2004). Sentence-based natural language plagiarism detection. ACM Journal on Educational Resources in Computing (JERIC), Volume 4, Issue 4.
Lukashenko, R., Graudina, V. et Grundspenkis, J. (2007). Computer-based plagiarism detection methods and tools: an overview. In CompSysTech '07: Proceedings of the 2007 international conference on Computer systems and technologies. ACM.
CopyTracker. (2007). Site du logiciel CoypTracker. http://eleves.ec lille.fr/~antiplag05/index.php?page=main&lang=fr (accédé le 4 avril 2008).
Liste non exhaustive de logiciels de détection des similarités:
http://viper.infotech.monash.edu.au/damocles/about
http://www.turnitin.com/static/home.html
http://www.sixdegres.fr/servicesetproduits_compilatio.htm
http://www.ephorus.fr
http://www.lucboyer.com/renifleur
http://www.urkund.com/fr/index.asp
http://www.adwordsadsensetools.com
http://www.canexus.com/eve
http://plagiarism.phys.virginia.edu/Wsoftware.html
http://plagiarism.org
http://www.cs.berkeley.edu/%7Eaiken/moss.html
http://wwwipd.ira.uka.de:2222
http://iparadigms.com
http://www.internetactu.net/?p=2165
http://www.millikin.edu/staley/plagiarism.html