AI正在疯狂污染中文互联网（2 / 2）

（这样做）的目的是减缓使用ChatGPT创建的大量答案流入社区。

因为从ChatGPT得到错误答案的概率太高了！

他们认为以前用户回答的问题，都是会有专业知识背景的其他用户浏览，并给出正确与否，相当于是核实过。

但自打ChatGPT出现之后，涌现了大量让人觉得“很对”的答案；而有专业知识背景的用户数量是有限，没法把这些生成的答案都看个遍。

加之ChatGPT回答这些个专业性问题，它的错误率是实实在在摆在那里的；因此Stack Overflow才选择了禁用。

一言蔽之，AI污染了社区环境。

而且像在美版贴吧Reddit上，也是充斥着较多的ChatGPT板块、话题：

许多用户在这种栏目之下会提出各式各样的问题，ChatGPT bot也是有问必答。

不过，还是老问题，答案的准确性如何，就不得而知了。

但这种现象背后，其实还隐藏着更大的隐患。

滥用AI，也毁了AI

AI模型获得大量互联网数据，却无法很好地辨别信息的真实性和可信度。

结果就是，我们不得不面对一大堆快速生成的低质量内容，让人眼花缭乱，头晕目眩。

很难想象ChatGPT这些大模型如果用这种数据训练，结果会是啥样……

而如此滥用AI，反过来也是一种自噬。

最近，英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。

探讨了现在AI生成内容污染互联网的现状，然后公布了一项令人担忧的发现，使用模型生成的内容训练其他模型，会导致结果模型出现不可逆的缺陷。

这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲，未来通过抓取互联网数据来训练模型会变得更加困难。

论文作者，剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言：

正如我们用塑料垃圾布满了海洋，用二氧化碳填满了大气层，我们即将用废话填满互联网。

对于虚假信息满天飞的情况，Google

ain的高级研究科学家达芙妮·伊波利托(Daphne Ippolito)表示：想在未来找到高质量且未被AI训练的数据，将难上加难。

假如满屏都是这种无营养的劣质信息，如此循环往复，那以后AI就没有数据训练，输出的结果还有啥意义呢。

基于这种状况，大胆设想一下。一个成长于垃圾、虚假数据环境中的AI，在进化成人前，可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。

就像1996年的科幻喜剧电影《丈夫一箩筐》，影片讲述了一个普通人克隆自己，然后又克隆克隆人，每一次克隆都导致克隆人的智力水平呈指数下降，愚蠢程度增加。

那个时候，我们可能将不得不面临一个荒谬困境：人类创造了具有惊人能力的AI，而它却塞满了无聊愚蠢的信息。

如果AI被喂进的只是虚假的垃圾数据，我们又能期待它们创造出什么样的内容呢？

假如时间到那个时候，我们大概都会怀念过去，向那些真正的人类智慧致敬吧。

话虽如此，但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题，并推出相关规定加以限制。

一些个AI公司也开始搞能鉴别AI生成内容的技术，以减少AI虚假、垃圾信息的爆炸。

参考链接：[1

来源：量子位，作者：金磊尚恩，原文标题：《AI，正在疯狂污染中文互联网》。

综合其他相关阅读：三国：我汉室宗亲，夺天下气运十方天帝百兽海贼团：凯多的许愿神龙龙之少女从球迷到超级球星帝道传承我以简化养生术得长生神话序列：我觉醒二郎真君全民御兽：我掌握最强进化路线游戏停服，只有我知道入侵现实

我的人工智能变成了赛博妖魔所有内容均来自互联网，BT天堂小说吧只为原作者某天的云的小说进行宣传。欢迎各位书友支持某天的云并收藏我的人工智能变成了赛博妖魔最新章节。