El Grupo de Ingeniería Lingüística del Instituto de Ingeniería, de la Universidad Nacional Autónoma de México (UNAM), desarrolla una herramienta, “Simil”, que busca eliminar el “copy-paste” al detectar las similitudes entre oraciones de diferentes textos.
“Símil” permite categorizar las semejanzas de ideas entre los textos, aunque estas no estén expresadas literalmente con las mismas palabras, lo que no necesariamente dictamina una violación en el derecho de autor, explicó el titular del Grupo de Ingeniería Lingüística (GIL), Gerardo Sierra Martínez.
La herramienta fue puesta a prueba con un escrito de 27 frases sobre la historia de sushi que fue extraído de Wikipedia y fue comparándolo con textos de estudiante, niños y expertos que parafrasearon las líneas.
Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia”, comentó Sierra Martinez.
“Símil” realizó una selección de las frases con paráfrasis y las ordenó por colores para mostrar el grado de similitud: rojo para las que tienen mucha cercanía al texto original, amarillo las que tienen un grado menor y gris para las que casi no coinciden.