PlaM-DeP: a modular platform for the development and evaluation of academic plagiarism detection algorithms

Main Article Content

Hernán Fajardo Heras
Manuel Barrera Maura
Vladimir Robles Bykbaev
Cristian Timbi Sisalima
Eduardo Calle Ortiz

Abstract

In this paper we present a software platform model to develop and evaluate plagiarism detection algorithms. The platform is based in a scalable modular design, and implements several services to perform automatically the following tasks: syntactic and semantic analysis through WordNet and Freeling, automatic text extraction of multiple file formats (PDF, Word and text), web page content extraction (using some search engines like Google, Yandex, Yahoo, Bing), and storage, load and use of plagiarism detection algorithms. These services allow a programmer to develop a code focusing the effort on the design of the algorithm and the mathematical/statistical basis. The platform was tested using several text queries (n-grams), and currently the performance results are promising.

Article Details

Section
Scientific Paper
Author Biographies

Hernán Fajardo Heras

Colaborador del Grupo de Investigación en Sistemas Informáticos e Inteligencia Artificial, Carrera de Ingeniería de Sistemas, Universidad Politécnica Salesiana, sede Cuenca. 

Manuel Barrera Maura

Colaborador del Grupo de Investigación en Sistemas Informáticos e Inteligencia Artificial, Carrera de Ingeniería de Sistemas, Universidad Politécnica Salesiana, sede Cuenca. 

Vladimir Robles Bykbaev

Máster en Inteligencia Artificial Reconocimiento de Formas e Imagen Digital, Ingeniero en Sistemas, Estudiante de Doctorado en Tecnologías de la Información y las Comunicaciones – Universidad de Vigo, Coordinador del Grupo de Investigación en Sistemas Informáticos e Inteligencia Artificial, UPS, sede Cuenca.

Cristian Timbi Sisalima

Máster en Project Management, Ingeniero en Sistemas, Docente Investigador del Grupo de Investigación en Sistemas Informáticos e Inteligencia Artificial, UPS, sede Cuenca

Eduardo Calle Ortiz

Máster en Tecnologías de la Información en Fabricación, Director del Centro de Investigación, Desarrollo e Innovación en Ingeniería, UPS, sede Cuenca. 

References

IEEE. Plagiarism. http://www.ieee.org/publications_standards/ publications/rights/plagiarism_FAQ.html

H. A. Maurer, F. Kappe, and B. Zaka, “Plagiarism-a survey.” Journal of Universal Computer Science, vol. 12, no. 8, pp. 1050–1084, 2006.

El Espectador. (2012) Suspenden a periodista de time y cnn por un caso de plagio. [Online]. Available: http://www.elespectador.com/ impreso/cultura/medios/

A. Rodríguez, “Plagios y fraudes en la era de la globalización,” Revista médica de Uruguay, no. 22, pp. 83–86, 2006.

ATL (Association of Teachers and Lecturers). (2008, January, 18) School work plagued by plagiarism atl survey. [Online]. Available: http://www.atl.org.uk/media-office/media-archive/ School-work-plagued-by-plagiarism-ATL-survey. asp

H. Maurer. (2007, October 15) Narayanan kulathuramaiyer, coping with the copy-paste-syndrome. World Conference on ELearning in Corporate, Government, Healthcare, and Higher Education. [Online]. Available: http://www.editlib.org/p/26479

S. Urbina, R. de Ozollo, J. Gallardo, C. Martí, A. Torres, and M. Torrens. (2010) Análisis de herramientas para la detección del ciberplagio.

A. Cedeño, M. Vila, and P. Rosso, “Detección automática de plagio, de la copia exacta a la paráfrasis,” pp. 76–96, 2010.

D. Rodríguez-Torrejón and J. Martín-Ramos, “Leap: Una referencia para la evaluación de sistemas de detección de plagio con enfoque intrínseco,” Universidad de Huelva, pp. 1–12, 2012.

Turnitin. Detector de plagio online. [Online]. Available: http://turnitin.com/es

D. Fúnez and M. Errecalde, “Detección de plagio intrínseco usando la segmentación de texto,” in CACIC – XVII Congreso argentino de Ciencias de la Computación, 2011, pp. 91–100.

M. Potthast, A. Barrón-Cedeño, B. Stein, and P. Rosso, “Cross-language plagiarism detection,” Language Resources and Evaluation, vol. 45, no. 1, pp. 45–62, 2011.

M. Potthast, B. Stein, A. Barrón-Cedeño, and P. Rosso, “An evaluation framework for plagiarism detection,” in Proceedings of the 23rd international conference on computational linguistics: Posters. Association for Computational Linguistics, 2010, pp. 997–1005.

S. M. Alzahrani, N. Salim, and A. Abraham, “Understanding plagiarism linguistic patterns, textual features, and detection methods,” Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 42, no. 2, pp. 133–149, 2012.

M. Ortiz and A. Plaza, Programación orientada a objetos con Java y UML, 1st ed. Editorial Universitaria Abya-Yala, 2014.