Turnitin+AI查重系统的检测机制是怎么样的?

发布于 2025-01-06 16:27
毕业在线网论文检测平台

文本预处理


  • 格式规范检查:系统会先对提交的论文进行格式检查,确保文件格式符合要求,如.doc、.docx、.pdf、.txt、.rtf 等。
  • 提取文本内容:将论文中的文本内容提取出来,去除图片、表格、图表等非文本元素,只对其中的散文句子进行分析,不包括列表、要点或其他非句子结构。

AI 生成内容检测


  • 文本片段划分:将文章分成大约几百字的文本片段,每个片段通常包含五到十个句子。
  • 上下文捕捉与打分:对每个文本片段中的句子进行上下文捕捉,分析句子的语言结构和词汇使用等特征,给每个句子打 0 到 1 分。如果确定一个句子不是由人工智能产生的,会打出 0 分;如果确定该句子的全部内容是由人工智能产生的,会打出 1 分。
  • 总体预测结果生成:取所有文本片段的平均分数生成一个总体预测结果,即系统认为提交的论文中有多少文本是由人工智能生成的,这个结果有 98% 的可信度。
  • Turnitin+AI查重系统的检测机制是怎么样的?

重复率检测


  • 数据库比对:把预处理后的论文文本与 Turnitin 庞大的数据库进行比对,该数据库包含互联网上的资源、以前提交的论文、学术出版物等。
  • 语义与文字比对:运用自然语言处理算法和模糊匹配技术,对每篇提交检测的学术论文的语言结构和词汇使用进行深入分析,识别出与已有文献相似部分的内容,不仅仅是简单的文字比对,还会结合上下文的意思进行语意比对3

结果呈现与报告生成


  • 颜色标记:在查重报告中,会用不同颜色来标记不同的相似度范围和 AI 检测结果。如蓝色表示百分比显示在 0 到 100 之间,代表着提交的文件已经成功处理,显示的百分比表示检测出的由 AI 产生的文本的数量;灰色表示 AI 写作检测功能无法处理提交的内容3
  • 详细报告:除了总体的相似度百分比和 AI 生成内容的占比外,还会列出相似部分的来源、单篇的重复率等,方便作者识别并修改抄袭部分。

阅读量:
免责声明:本文内容由互联网整合上传,本网站不拥有所有权,也不承担相关法律责任。如果您发现本网站中有涉嫌抄袭的内容,请联系客服进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。