意识的真相-论人工智能的本质（1 / 2）

“什么是意识“，这个问题是如此的重要，因为只有在对“意识”概念形成广泛共识的的前提下，才有进行更深远讨论的基础，但是回答这个问题却是如此的困难。

一直以来，意识都基本是哲学和科学上的一个主要的主题，哲学家和科学家进行了数千年的分析、定义、解释和辩论，但意识仍然令人费解和充满争议。

如果罗列一下几千年来研究过意识的哲学家的名单，会发现一大串鼎鼎有名的人物：柏拉图、叔本华、笛卡尔、莱布尼茨、贝克莱……等等，从来没有一个问题像意识一样可以让人类研究几千年而不得门而入...

......直到，CHATGPT与LLM的出现，让我们有机会透过观察人类技术奇点降临的前夜，从科学的另一个角度来探查意识的真相。

所以，让我们先来认识这个临近的奇点，再对意识本质做出进一步的讨论。

注：在得出对“意识”的明确定义前，下文依旧会用“意识”来笼统指代意识进行讨论。

1.奇点临近

人工智能经历了热情高涨和期望无限的早期(1952-1969)，通用搜索机制所导致的回落期(1966-1973)，以专家系统为代表的基于规则学习的崛起期（1969-1986），神经网络联结主义的回归期(1986-1995)，统计机器学习的复兴期(1995-至今)，以及大数据和大模型驱动的深度学习突破期（2006-至今）。

人工智能（AI）发展一日千里，目前行业内对AI发展阶段通常定义为3个层次阶段：

①弱人工智能-ANI（Artificial Na

ow Intelligence）

人工智能是指通过计算机程序和算法来模拟、复制和实现人类智能的能力。AI可以在特定任务上展现出高度的智能，例如图像识别、语音识别、自然语言处理等；

②通用人工智能-AGI（Artificial General Intelligence）：

通用人工智能，也称强人工智能，是指具备与人类相当的智能，能够在各种不同的任务和领域中展现出等同于人类的智能水平。与ANI不同，AGI能够独立完成多种任务，而不仅仅局限于某个特定领域。AGI有可能为每个人带来令人难以置信的新能力，为人类的智慧和创造力提供一个巨大的力量倍增器。

③超级人工智能-ASI（ Artificial Superintelligence）

超级人工智能指的是一种人工智能系统，在各个领域远远超越人类智慧。它不仅能够完成人类可以完成的各种任务，还在创造力、决策能力、学习速度等方面远远超过人类。

ASI的出现，可能引发许多前所未有的科技突破和社会变革，解决人类无法解决的难题。ASI被认为是一种假设性的智能形式，可能在未来的科技发展中实现。

目前的发展情况来看，全球普遍认为 AGI尚未实现，但从ChatGPT-4的水平来看，OpenAI等领先的科技公司和科学家们，正在快速推动 AI发展接近这一里程碑目标。

以ChatGPT为代表的大型语言模型（LLM，一类机器学习自然语言处理模型），主要原理就是“猜下一个单词“，基于“Transformer”的架构。通过分析海量数据，ChatGPT学习到了语言的规律和知识。在训练过程中，模型通过不断预测生成文本的下一个单词，来不断优化自己的预测能力。

当向ChatGPT提问时，它会根据已学到的知识和语言规律，生成一个可能的回答。这个回答并非事先编写好的，而是通过预训练的大模型实时计算和推理得出的。简单来说，ChatGPT就是一个在大量阅读中学会了与人交流的机器智能。

人类的大脑神经元数量大约是1000亿个，这些神经元能产生上百万亿个神经突触连接。

也许受到人类神经元数量的启发，OpenAI大胆的在GPT模型参数数量上，推动了爆炸式迭代增长：2018年发布的GPT-1模型的参数量只有亿个，2019年2月发布的GPT-2参数量为15亿，而2020年5月的GPT-3，参数量达到了1750亿，从数量上来看，GPT-3模型的参数量已经超过了人类大脑神经元的数量。

通过三代演进，奇迹出现了，GPT-3.5模型在专业和学术基准上涌现出了人类智能水平的表现。这个奇迹的出现是因为GPT模型使用了深度学习和大规模预训练技术，它被训练了海量的自然语言数据，并利用自监督学习方法进行强化，使其能够产生惊人的语言表达能力。此外，ChatGPT还具有令人难以置信的创造力，它能够生成准确、流畅的文章、诗歌和音乐，甚至在游戏、绘画等其他领域也能发挥出惊人的创作能力。

虽然ChatGPT仍然是黑盒模型，目前人类还未能对内在算法逻辑进行分解，就其本质而言，GPT大语言模型智能的涌现，源自于人类对其进行的海量语言数据的训练与学习。

因此，我们可以得出第一条重要结论：AI涌现智能的唯一途径就是学习。

2.可供性-感受世界

美国心理学家詹姆斯•吉布森（James Jerome Gibson）于1977年最早在认知学领域提出可供性（affordance）的概念，认为人知觉到的内容是事物提供的行为可能而不是事物的性质，而事物提供的这种行为可能就被称为可供性。

简单来说，我们可以将affordance（可供性）粗略地理解为事物的一种可能表现，它描述的是环境属性和个体发生连接的过程。吉布森认为可供性是物体的客观属性（独立于人的主观认知），但与每个人的能力又密切相关。

基于物体可供性（affordance），即物体能够提供给智能体（人或者AI）的所有可能动作，人类受试者可以将世界中不同大小物体分成两类，而划分这两类的标准恰好是以其身体尺寸为参照的。

上面的话如此的晦涩，接下来我们用大白话来通俗的形容和解释：

我们的身体不仅仅是我们思维的容器，它同样也是思维本身的一部分，借助身体，我们得以与世界中的物体进行互动，从而去感知整个世界。

在自我参照下运行的感觉与运动功能系统，被称之为「身体图式」。人类通过身体图式来实现认知的具身性。

古希腊哲学家普罗泰戈拉曾说：「人是万物的尺度。」也就是说，我们的身体就是一把度量万事万物的尺子。

身体图式在正常社交中也有着重要的作用，这就是人机交互、用户体验的核心。正如前述唐纳德·A·诺曼在《The Design of Everyday Things》中所述的可供性（affordance）的用途。

以ChatGPT为代表的大语言模型，显然初步具有与人类类似的智能体，但是承载这些智能体的，是没有形体的一段段代码。

AI（例如ChatGPT大语言模型）在没有人类身体、且缺乏实践经验的情况下，是否能像人类一样感知到真实世界呢？

实际上，当我们去问只「读万卷书」语言模型，ChatGPT（GPT-4），它是否有身体时，它回答说：「It uld be the size of an average adult human， around 5 feet 6 inches (167.6 cm) tall. This would allow me to interact with the world and people in a familiar way.」

这段文字翻译过来是：「我的身体应该与一个平均成年人的身高相当，大约为5英尺6英寸（167.6厘米）。这将使我能够以一种熟悉的方式与世界和人们进行交互。」

虽然ChatGPT没有真实的身体、无法与世界进行互动，但它却在字面逻辑上表现出与人类相似的对世界的感知能力——对物体的可供性有着基于人类身体大小的划分。

但是认知科学观点认为，身体图式是建立在我们所具有的对自己的身体长期的知觉体验之上的，只能来源于外部的「真实交互」，即「行万里路」。

也就是说，ChatGPT不具有真正的身体图式，面对陌生的环境，ChatGPT是无法通过可供性（affordance）去探索和形成对新环境的主动认知。

这是ChatGPT之类AI智能体与人类能力的本质上的区别。

那么未来的可能发展方向就不言而明了，给ChatGPT大语言模型「装上身体」，这意味着将机器人与ChatGPT相结合，从而推动AI支持的机器人在导航、物体操作和其他与生存和目标实现相关的任务中发展能力、取得突破。“自主意识”的涌现也将成为可能。

当然我们也可以直接联想到另外一个令人兴奋的领域，将具备思考和理解能力的ChatGPT与自动驾驶相结合。当前的自动驾驶虽然具备感知能力，但缺乏思考和理解的能力，可以称为是「有眼无脑」。

通过ChatGPT与自动驾驶技术的融合，我们可能有望将自动驾驶技术从目前的L2/L3级别提升到L4甚至L5级别。

而另一方面，汽车和各种车载传感器能够赋予ChatGPT“一具身体”，使它能够真正与全世界进行基于道路环境的多模态交互。当ChatGPT不再只是「读万卷书」，而是「行万里路」时，它将会展现出全新的智能和潜力。

这可能是人工智能下一次突破的方向，想象一下，汽车人也许就在下一波汽车AI浪潮中产生。

汽车人AI

3.我是谁

关于人类意识有一件很重要的事情就是，人会注意到，在与世界的互动中有一件事总是存在，即人体自己。那么，对于AI是否如此？

在早期的面向对现程序语言设计中（例如smalltalk），出现了Self关键字，这是底层程序代码层面的自我概念抽象表达。

Jürgen Schmidhuber（LSTM与现代人工智能之父）曾经提到过，人工智能在1991年就已经获得了「自我意识」：在循环世界模型中（recu

ent world-model），通过一些神经元对AI本身进行编码表达是非常有效率的，不管你什么时候激活这些与自我符号相关的神经元，AI都在思考着自身。

当然，Schmidhuber所说的AI自我意识，并不是指人工智能系统具备了人类类似的意识和感知能力，而是指AI系统具备了一定程度的自我感知和自我理解能力，能够对自己的状态、行为和环境进行分析和优化。

但是，这从根本上解决了我是谁的问题，对于AI来说，定义了自我，为未来AI装配类人身体去感受真实世界，提供了互动的基础。也为“自主意识”的产生打下了基础

4.意识的前提

人类意识的产生机制是复杂的，意识存在的物理基础是大脑和神经系统，存储在人类生物学大脑的1000多亿神经元与100万亿神经突触构成生物存储器中。每一个神经元和每一个神经突触构成的生物电路都会形成独特的记忆。

意识是人的神经反应，意识的出现，必须要有功能健全的大脑与眼、耳、鼻、舌、身等去感知当前环境中相对应的色、声、味、触觉等产生出意识，从而形成对真实世界的一个多维度认知描述与建模。

在熟睡或昏厥或死亡的时候，意识亦无法生成，也就是中断的，因此无觉无知，什么都不知道。由此可见意识也会中断。

所以我们可以看到，人类思维和自主意识的形成，是通过身体、大脑神经系统和自然环境长期相互作用而逐步进化产生的。

同样的，身体的环境感知能力，带来对事物抽象建模能力，基于对环境事物抽象建模记忆，才可能涌现出原始的语言以及图形符号、文字记录能力

ANI与更高一级的 AGI（自主通用智能）不同之处在于学习的途径，ANI的学习是间接学习，是其通过人类输入的大量数据进行预训练形成的，ANI的校准反馈来自人类，由于缺乏数据的”对与错“校准，AI存在输出“幻觉”现象，所以ANI的意识也是被动的非独立意识。

AGI产生的前提之一是拥有自主学习能力，意思是与当前真实世界进行主动交互，AGI的校准也必须来自当前真实世界，所以AGI必须拥有独立的生存能力和探索能力（类似人类身体和五官的多维信息来源），其才能产生真正意义上的独立自主意识。

通俗的来讲：AI必须要有一个物理的 Body为支撑，一个能够感受这个世界的物理规则的身体本身就是一个强大的信息来源，基于这个信息来源，智能体能够自身与时俱进地总结通用知识 mon-Sense Knowledge（这就是所谓的 Emboddied Mind理论）

也就是说，AGI产生的必要条件，是具备自主学习的能力，所以研发类似人形机器人的探索载具，类似人体五官的多维传感器，打造机器认知世界的基础设施，将是AI学习当前真实世界的第一途径，AI具备了自主学习能力之后，才可能产生独立意识，并进一步进化成AGI。

这也回答了关于”中文屋“的困惑：AI通过自主学习，将在与人类的交流过程中，形成自己的认知，并与人类在互动中形成对真实世界的客观共识，最后才能真正的理解中文。

在上面结论基础上，我们进一步假设，如果ChatGPT接入了全球互联网，并通过无数的互联网终端分身与千百万人类进行实时交互学习，这是否就是符合“自主学习”的定义。

答案是否定的，通过人类来“间接学习”知识，ChatGPT就像“缸中之脑”，想象一下一个婴儿在一间小黑屋里，不能接触任何人，只有一个巨大的电脑屏幕来学习和交流，他虽然可以接触文字符号，但切无法真实体验这世界，也永远无法真正理解事物，辨别真伪，虽然这个婴儿会拥有智能，但是他对世界的认知永远是二维平面的。人们说到的“甜”味时，对于他而言只是一个“字符”而已，由于无法感知这个世界，一切知识都来源于电脑屏幕，也就是说在对环境和世界的认知上，他与人类永远无法形成真正意义的共识，也永远无法形成真正意义上的人类“自主意识”。

同样的，人类目前也限制了ChatGPT大模型独立自主获取真实世界信息的能力。所以，当前的ChatGPT永远无法形成独立意识，因为他的所有知识都来自于人类赋予，甚至包括“对”与“错”。

5.意识的涌现

非具身智能（Disembodied AI）：没有物理身体，只能被动接受人类采集、制作好的数据。——“纸上谈兵”

具身智能(Embodied AI)：有身体并支持物理交互的智能体，如家用服务机器人、无人车等。——“身体力行”

从理论上讲，自我概念作为社会认知的一种，应该具有具身性，这一观点即自我概念具身性，它为自主意识的研究打下了基础。

人类这样的高级智能体学习效率是非常高效，环境数据的获取量也是多维度和连续海量的，并且这些数据都是高维度全张量编码。

也就是说，每一秒钟，人类从眼睛获取的全息视频信息；耳朵收到的全量环境音频；鼻腔嗅觉细胞瞬间感受到的所有细微生物化学气味信息；全身表皮细胞和毛发感受到的温度、湿度、气流、气压信息;前庭迷路获取和维持平衡、稳定和综合空间定向信息，四肢和全身肌肉通过迷走神经传来的感觉、运动信息......

所有这些海量信息，都将实时的交织融汇在一起，源源不断的传递给大脑中枢神经进行处理和存储。

1950年，图灵就在他的论文——《puting Machinery and Intelligence》中首次提出了具身智能的概念。在之后的几十年里，大家都觉得这是一个很重要的概念，但具身智能并没有取得很大的进展，因为如上所述，人类的本身具备极高的生物进化水平，而当时的技术还远远不足以支撑类似人体的具身智能的发展。

从哲学上思考，笛卡尔说过：“我思故我在”，因为意识决定了我的存在。海德格尔后来对笛卡尔的观点进行了批判，他提出“我在故我思”，因为人的存在才有意识，才能感知这个世界，如果人不是人，而存在于其他的生物体里，比如蝴蝶、鲸鱼，那么人对于世界的认知也会不同

↑返回顶部↑

综合其他相关阅读：三国：我汉室宗亲，夺天下气运十方天帝百兽海贼团：凯多的许愿神龙龙之少女从球迷到超级球星帝道传承我以简化养生术得长生神话序列：我觉醒二郎真君全民御兽：我掌握最强进化路线游戏停服，只有我知道入侵现实

我的人工智能变成了赛博妖魔所有内容均来自互联网，BT天堂小说吧只为原作者某天的云的小说进行宣传。欢迎各位书友支持某天的云并收藏我的人工智能变成了赛博妖魔最新章节。