耿同学,一个退学博士是怎么用AI降维打击学术圈的?解析(2)
文学圈的回响
如果说耿同学的故事是"技术赋能"的第一版本,那么"抒情的森林"的故事就是第二版本--它同样印证了技术正在把监督权从中心推向边缘,只不过用的是另一种工具。
抒情的森林是谁?从公开信息来看,他是一位普通的读书博主。从2024年10月开始,他陆续公开了数十位作家已出版作品中与其他作家相似的部分语句和段落,引发舆论剧震。
他在一次采访中坦陈:"我从0人关注开始发帖,很少下判断,只呈现文本对比。直到今天,我更多的也只是展示事实本身,将判断交给看帖子的人。"
过去界定抄袭,需要专家意见,需要法律程序,需要大量的专业辩论。而现在,抒情的森林只用了最基础的"文本比对"--这是任何一个识字的人、会使用搜索引擎的人都能独立完成的。
比如,他把贾平凹的《三十未立》和美国作家华盛顿·欧文《英国的农村生活》并列排在一起,让读者看到两段文字几乎完全相同,这样简单的技术工具就可以让传统上依赖专家权威才能做的事情,变成了任何人都能参与的"判断题"。
在这一点上,耿同学和抒情的森林是殊途同归的,一个靠的是AI图片比对和统计学分析,把高深的学术论文变成了数据题;另一个靠的是文本比对和互联网搜索,把模糊的抄袭争议变成了直观对照。
抒情的森林面对"你是不是为了流量"的质疑时的回应同样值得品味。他说:"我无法阻止别人的质疑,甚至欢迎别人的质疑,但大家凡事不要代入过甚,以己度人,流于诛心之论。讲话尽量有理有据,至少我自己是这样要求自己的。你质疑的,有根据吗?"
用证据说话,君子论迹不论心,当证据足够清晰,动机就成了无关变量。
风暴背后
技术的发展让普通人拥有了质疑权威的能力,很多人把这称为"技术平权",技术赋予了普通人挑战权威的能力,这是积极的一面。但这场风暴另一个值得深思的问题是:为什么"耿同学"和"抒情的森林"做的,本该是体制本身应该做的事?
耿同学本人对此有一个非常坦率的观察:"这段时间做打假以来,没有任何一篇问题论文,是官方自己去找出来的。这是迄今为止让我感到最失望的一点。"
他公开承认,自己发布的每一篇造假论文,"都不是我自己闲着没事去扒拉的,而是我认识的朋友或者热心网友先发现了,再转发给我的"。也就是说,发现问题的人,压根不是那些本该在审核机制里把关的人。
抒情的森林也遭遇了同样的现象--被点名的近40位作家,除了86岁的杨本芬发文致歉,绝大多数选择沉默。学术圈也几乎是同一个剧本:除了饶毅等极少数人发声,那些平时活跃的院长们、杰青们集体沉默。没人说这是污蔑,因为证据就在那儿;也没人否认,因为承认就等于承认自己和他们是一伙的。
在一个健康的社会里,学术论文有没有问题,理应由学术共同体的内部审核机制来保障;文学作品是否抄袭,理应由出版行业自律和作者诚信来维系。但现在,这些本该由体制完成的事情,却要依靠两个"志愿者"用业余时间来完成,这是远远不够的。
耿同学的视频火了后,同济大学的王平已经被免去院长职务,降低专业技术岗位等级两级,涉事论文第一作者被解除聘用关系。南开大学、中山大学、上海大学都已成立调查组。
5月17日,耿同学再次发布视频,喊话四所高校的五位"杰青",要求他们先自查整改,否则将再次举报。据他透露,这几篇被质疑的论文均涉及Nature正刊或子刊。他对《三联生活周刊》透露,第一条打假视频发出后,他已经收到超过100条打假举报。
也就是说,我们目前看到的,可能只是冰山一角。
对于这场风暴,我们不能止步于揪出几个造假者,它应该催生更深层的变革,比如监督机制的现代化,Nature出版社母公司在2025年就已经开始用AI做论文审查,没错,就是用AI来查造假。事实证明,其实基础的审查技术方案已经很成熟了,统计学检验、AI图片比对、数据查重,哪一样是今天的技术做不到的?问题不在于"能不能做",而在于"愿不愿意做"。
又比如,当前的科研评价体系是不是需要变革了,当论文数量、项目经费、人才"帽子"与资源分配深度绑定时,学术就容易被异化成一场"绩效竞赛",很多造假也就是这样来的,毕竟这些造假的背后都是利益。