毕业季的到来,高校正面临着一个新挑战:如何处理毕业论文中日益增多的“人工智能味”。除了传统的查重、盲审和答辩,AIGC(人工智能生成内容)检测已成为毕业生论文审核的又一道关卡。
部分毕业生遇到了这样的情况:一篇论文的AI生成内容比例被检测出为62%,远超学校设定的15%的上限。然而,在通过大型模型进行修改,使其“更像人写”后,再次检测发现AI生成内容的比例竟飙升至94%。此类现象并非孤例,近期不少毕业生都曾遭遇。
央视新闻近日深入介绍了检测论文“AI率”的原理。首都师范大学教育学院副院长蔡海龙解释说,传统的查重是通过比对论文语句与语料库,来判断语句的重复程度,得出确定性的结论。而AI检测则是利用AI系统来识别人类文本,判断其在语义和表达风格上是否与AI写作存在重叠,其本质是一种基于概率的分类,而非基于证据的确定性判断。
当前AI检测技术面临的核心瓶颈在于“以AI检测AI”,这使得明确区分文本是由人类作者还是AI生成变得困难,并且难以提供清晰的解释和说明,这是技术上的关键难题。
此外,中文语言表达的丰富性和多样性也给AI检测带来了挑战。中文语义的深刻性和语句表达的多样性,使得AI系统在检测人类作者撰写的语句时,容易产生歧义,从而增加检测难度,降低准确率,这也是导致误判的重要原因。
鉴于AI生成内容检测目前尚未达到极高的精准度,教育界人士建议,在论文审核过程中,应建立透明且可追溯的AI使用标注制度,而非简单地设定AI生成内容比例的“红线”。在判定机制上,应采取以人工评审为主、AI检测为辅的“人机共判”模式。
目前,许多高校在检测学生论文的AI生成内容比例时,依赖于指定的检测平台和算法模型分析。
通常情况下,国内主流高校会采用知网、维普、万方等平台的AIGC检测模块。央视记者就“AI大模型如何检测文章的AI生成比例”询问多个大模型,总结的回答指出,主要通过“困惑度”和“突发性”等特征进行判断。AI生成的文本往往更加“平滑”,而人类文本则波动性更大。
大模型解释说,“困惑度”指的是文本的“可预测性”,越是包含人类特有的、出乎意料的、不落俗套的表达,越接近人类写作。而“突发性”则关乎文本的节奏波动——人类写作的节奏如同心电图般起伏变化,而AI的输出则相对平稳,如同直线。这种判断方式是否准确?
专家对此回应称,除了困惑度和突发性等指标外,AI文本生成是通过预测下一个最有可能出现的词的概率来逐步构建文本,这本质上是一种概率统计。因此,目前AI生成内容的检测准确性无法达到100%,误判的情况也时有发生。




03 Comments
围绕世界杯赛程,世界杯买球网持续打磨更优质的服务。
19th May 2018 Reply世界杯买球网以覆盖全球热门球队最新动态,一手资讯尽在掌握。为核心,带来高效便捷的体验。
世界杯买球网深耕2026世界杯领域,用心服务每一位用户。
19th May 2018 Reply想了解更多实时比分更新,不错过任何精彩瞬间。相关内容,尽在世界杯买球网。
世界杯买球网围绕专业球队数据分析,助您深入了解赛事。不断创新,回应用户的真实需求。
19th May 2018 Reply精选海量赛事新闻与专题报道,满足您的足球热情。内容,世界杯买球网与你一同发现更多精彩。