home

Exactus Like – система выявления заимствований в научных текстах

?
Exactus Like –
система выявления заимствований в научных текстах
Exactus Like –
system for detecting reused text in scientific publications
Г. С. Осипов, И. В. Смирнов,
И. А. Тихомиров, И. В. Соченков, Д. В. Зубарев
Институт системного анализа РАН,
Москва, Россия
Gennady Osipov, Ivan Smirnov,
Ilya Tikhomirov, Ilya Sochenkov and Denis Zubarev
Institute for Systems Analysis, Russian Academy of Sciences,
Moscow, Russia
В докладе представлена система Exactus Like, предназначенная для выявления смысловых текстовых заимствований в научных публикациях. Рассмотрены принципы работы и функциональные
возможности системы.
The paper presents Exactus Like – the system for detecting reused text in scientific publications. The basic
functionality and features of the system are considered.

Система Exactus Like предназначена для выявления смысловых заимствований в научных текстах и оценки оригинальности научных текстов. Система является инструментом, помогающим
студентам, аспирантам, научным сотрудникам в написании рефератов, курсовых, дипломных
работ, кандидатских диссертаций и авторефератов, научных статей и других научных работ.
Система также может быть использована преподавателями для проверки студенческих работ,
редакторами научных журналов и издательств, организаторами научных конференций для проверки поступающих научных публикаций на оригинальность. Кроме того, система может быть полезна диссертационным советам для проверки диссертаций и различным ведомствам для проверки
оригинальности отчѐтов о НИР.
Метод выявления смысловых заимствований

Подходы к анализу научных текстов, используемые в системе Exactus Like, основаны на методах реляционно-ситуационного анализа текстов [1]. В отличие от других аналогичных систем, в
Exactus Like тексты подвергаются глубокому лингвистическому анализу, включая морфологический и синтактико-семантический анализ [2]. Использование результатов лингвистического
анализа текстов позволяет выявлять не только дословные заимствования, но и смысловые заимствования с учетом перефразирования, замены слов синонимами, перестановки местами слов и
предложений. В таблице 1 приведены примеры выявленных системой заимствований со значительным перефразированием и их источников. Жирным выделены совпадающие слова.
Таблица 1 – Примеры выявленных перефразированных заимствований
Проверяемый текст

Текст источника

В безглагольных предложениях или предложениях, для которых предикатное слово не
найдено в словаре, синтаксемы присутствуют
рядом с другими элементами предложения,
и несут свое значение только в данном контексте.
Прямые прокси содержат адрес сервера, т.е.
имя хоста и номер порта.

В безглагольных предложениях синтаксемы
присутствуют рядом с другими элементами
предложения и несут своѐ значение только в
данном контексте.
Прямые прокси (direct proxy) содержат информацию об адресе сервера в виде идентификатора
протокола, имени хоста и номера порта

1