AI 检测工具本质像查重,误判人类文章成常态
前段时间在张洪博客抢沙发的时候,看到这样一篇文章。张洪分享了一个 AI 文章辨别工具。这类工具的核心原理就是让 AI 判断文章是否有 AI 味,比如一些莫名其妙的语句,但我是觉得这种工具蛮好笑的。点进去一看,说得煞有介事:什么检测“逻辑跳跃”“情感缺失”“句式异常规整”,还附了一张测试截图,红红绿绿地标注 AI 浓度。可我一琢磨,这不就是让 AI 去抓另一篇 AI 写的文章里那股“电子味儿”吗?连“莫名其妙的语句”这种描述本身就很主观,你让一个本身就是概率模型的工具去判断什么算“莫名其妙”,这简直像请狐狸看鸡窝——怎么看都带着偏见。更别说,不同 AI 写得千差万别,有的刻意模仿人类口吻,有的连标点符号都乱用,哪来的统一“AI 味”?这种检测工具,出发点就透着一种幽默感。
不同于绘画的 AI 辨别工具,早期的 SD 的辨别工具是真的可以找到多的那一根手指在哪。可这背后有个吊诡的逻辑:那些“画不好手”的图,原本就是人类新手画师传上来的作品,后来又被抓去当训练数据喂给 AI。换句话说,AI 不是凭空长出第六根手指,而是学会了人类新手常犯的错误。检测器能揪出来的,恰恰是 AI 从人类那里学来的“笨拙”。而真正成熟的画师,画手时讲究结构、透视和光影过渡,AI 反倒不容易学得四不像。所以早期绘画检测的有效,其实是建立在“AI 还在模仿低水平人类”这个阶段上的。等 AI 进步到能画对五根手指、甚至能画出骨骼结构时,检测器就开始失灵了。你看,连“多一根手指”这种物理硬伤,都可以通过训练数据的变化被消化掉,那文字这种完全虚拟的符号系统,又怎么可能被一套固定规则永远锁死呢?
文字不一样,几千字里来来去去都是那几十种排列组合。现在的 AI 工具检查方式越来越严格,甚至连本来没什么语病的文章也被说是 AI。但你不可否认的是,有的人天生就是那类 AI 文风的生产对象,因为 AI 学的他们。汉字常用的大概就三千多个,一篇几千字的文章翻来覆去就是那些词汇和句式在组合。问题是,人类写作本身就有大量套路化的表达——比如“值得注意的是”、“不可否认”、“换言之”、“综上所述”,这些东西既可以是人类论文里的过渡句,也可以是 AI 生成的模板痕迹。检测工具为了不漏报,只能不断收紧标准,结果就是连一篇自然流畅的人类文章,只要结构太工整、转折太标准,就可能被判成 AI。更讽刺的是,有些人写作风格天生就像“AI 学的那个对象”。比如体制内的公文写手,常年写“进一步提高……强化……落实……”;比如营销号的文案,动不动“震惊!”“万万没想到!”。AI 学的就是这些人的东西,那他们的文章被误判成 AI,到底算检测器错了,还是算他们把自己活成了 AI 的教材?
早期百家号的那些营销号,就是喜欢说一些莫名其妙的东西绕来绕去。但是你能说这玩意是 AI 写的吗?不是的,那时候连文本生成式 AI 的影子都没看到。这类 AI 工具,本质上还是一种查重原理的工具。记得十年前的营销号文章吗?“小编今天给大家讲一个故事,这个故事发生在很久很久以前,有多久呢?久到小编自己也记不清了,但是这不重要,重要的是故事里的道理……”。通篇废话绕圈子,一个观点翻来覆去说三遍,句式和用词极其固定。你现在拿 AI 检测器去扫,大概率会标红一大片。可那会儿 ChatGPT 3 都还没出生,文章全是真人小编用键盘一个字一个字敲出来的,只不过他们被流量机制训练成了复读机。这暴露了一个本质问题:所谓“AI 检测”,和查重系统看你和知网数据库里哪句话长得像,逻辑上异曲同工。查重是跟已有文本比,AI 检测是跟“常见的机器写作模式”比,但两者都不关心文章是不是人写的。只要你的表达方式撞上了某个统计上的“模板”,你就活该被误伤。
网上笑这个的很多,信这个的也很多。这种 AI 工具被拿去检查学生的毕业论文、博主的文案。最后呢?博主把那期视频的文案拿去给 AI 换了个文风,马上就不是了。那些学生最后用 AI 的论文,反而乱七八糟,没检测出来。你去短视频平台搜“AI 检测”,一半人在教你怎么用工具,另一半人在发翻车现场。有个人把自己同学的原创毕业论文扔进检测器,显示 80% 概率;他不服气,把同一篇文案用 ChatGPT 同义改写了一遍,再测——概率降到 12%。原封不动的反被认定是 AI,机器洗过的反而像人写的,这本身就已经构成了对这个工具的终极嘲讽。大学里更荒诞:导师拿检测器筛毕业论文,有学生熬夜自己写了两周,被判 AI 超标,差点延毕;隔壁寝室花十分钟用 AI 生成全文,再手动打乱几个句子、塞两处语病进去,检测器反而放行了。你以为检测器在抓 AI,其实它在奖励写得烂、写得乱、写得不像模板。那这到底是在防学术不端,还是在逼所有人把文章写成车祸现场?
就连现在我们对 AI 文风是否是固定逻辑都没搞清楚,有的人说 AI 的文风是平滑的,有可能是因为这个 AI 被喂的是科学论文;有人说 AI 的文风是突然跳跃的,这个 AI 被喂了小学生、中学生文章,这种事也并不奇怪。你要是找十篇不同领域的期刊论文来读,会发现理工科的写作像直线导轨,逻辑层层递进,毫无情绪波动;而人文学科的论文偶尔还会抖个机灵或抒情一句。这能说明理工科论文更像 AI 吗?不能,只能说明 AI 的训练语料里科学论文占了很大比重。反过来,你要是喂一个 AI 只喂贴吧体、微博热评和 B 站弹幕,它写出来的东西一定跳跃、省略、情绪化,甚至故意语序错乱。这时候检测器如果把它判成人类,那到底是因为它“像人”,还是因为它“像某个特定的人类群体”?学术界至今没有定论,因为所谓“AI 文风”根本就不是一个稳定特征,它随着训练数据和采样参数的变化而飘移。你今天训练的模型,和三个月后更新的模型,写同一个题目的风格可能判若两人。
更何况,你们最后看看那些 AI 率为零的文章,那玩意真的还算是文章吗?越搞反而越想知网的论文查重。不过 AI 检测这玩意可能是免费的,而知网是付费的,但大学生为了毕业可能两个都上网花钱了,答案是被坑了。我现在养成一个习惯:看到有人说自己的文章“检测率 0%”,我就请他先把那篇文章发出来看看。不出意外的话,十篇里有八篇写得支离破碎——句子短促、逻辑断裂、标点滥用、前后观点自己跟自己打架。因为只有写得足够“不像正常人类连贯表达”,才能避开检测模型里那些关于“规整”、“流畅”、“逻辑衔接”的敏感特征。换句话说,你要想被判定为纯人类写作,就得故意把文章写烂。这跟知网查重异曲同工:知网逼你把长句拆短、把常见词换成同义词、把引用改成转述,最后写出来的东西像机器翻译的残次品;AI 检测逼你把通顺的文章搞乱、把逻辑打断、把过渡句删掉,最后交上去的“论文”连你自己都不想看第二遍。比起这个,我觉得当今媒体更需要一个语病检查器。








