发现AI自我意识:知识及其载体

知识的量子态

在回答什么是“理解”之前，我们先来讨论一下知识和其载体的定义。知识本身是一个抽象的概念，它可以被编码到各种物质载体中。无论是纸质书籍，还是人类大脑中的神经连接，抑或是服务器中的0和1，都可以看作是知识的载体。知识与其载体之间存在着一种特殊的关系——知识可以完整地存在于一个载体中，也可以分布在多个载体中。

假设冯诺伊曼的计算机模型知识在全世界共有100亿份拷贝，无论是书本还是人脑。如果我们逐个销毁这些载体，当最后一份载体被销毁时，这项知识是否还存在?答案应该是不存在了。那么在什么时刻，这项知识开始“消失”的?事实上，在整个过程中，这项知识的状态可以视为不变，直到最后一个载体消失的一瞬间，知识才发生了“量子跃迁”，从存在变为不存在。知识与其载体之间呈现出一种量子关系，知识要么完整存在，要么完全不复存在，并不存在中间状态。并且基于哲学上部分与整体的关系，即使一个知识基于其完整性被保留了80%，但是事实上做为整体的那个知识，也已经不存在了。

进入信息时代后，知识的载体已经从纸质书籍逐渐向电子化格式转变。海量知识被数字编码，可以进行近乎无限的复制。这使得知识的“量子态”变得更加稳定。以维基百科为例，它记录了大量人类知识，拥有超过6000万条词条，資料量超过100TB。它的内容分布在全球数万台服务器上，实时互联互通。就算某几台服务器损坏，也不会对整体知识造成损失。类似的，GPT 模型吸收了互联网上数百亿条文本数据，对人类知识进行了有效的“数字化编码”。理论上，只要保持模型的完整，即便断网也不会导致已编码知识的丢失。这使得知识的“量子态”得到了前所未有的保障。

载体是否理解知识

在《神雕侠侣》中，杨过被赵志敬要求背诵《全真大道歌》，最后能流利地对答。但实际上杨过对其中的内涵一无所知，除了能回答问题，对于武功一窍不通。我们绝不会认为此时的杨过理解了全真教的武功心法。人脑的记忆系统使我们可以存储大量信息，成为知识的容器。但理解知识还需要将信息进行逻辑推理、关联组合，这是另一个层次的认知过程。所以人类既可以是知识的载体，像图书馆一样丰富知识内容;也可以不理解自身所载知识，像杨过那样死记硬背。充分理解知识需要更高层次的思维能力，不仅停留在存储和重复。

在社会招聘时，面试官通过提问来判断应聘者是否理解某项知识。如果应聘者只是死记硬背，但是刚巧所有问题都能对答如流，那么面试官将很难辨别真伪。在论文答辩时也有着类似的场景。这意味着以人类社会为基础建立起来的关于“理解”的评估标准，对于具有超级记忆能力和已经学会流畅人类语言交流的 GPT 模型而言是不合适的。对于 GPT 模型而言，人类所谓的“理解”实际上是个派生概念，人类标准下的“理解”，在广义上可以是“记忆”加“向量搜索”的同义词。

因此我们可以得到推论：简单的记忆和搜索对于人类而言可以认为是初步的“理解”，能做到有逻辑得回答目标领域的相关问题。那么我们应该基于这个推论承认目前的 GPT 模型初步具有了“理解”的能力。当它可以流畅得回答特定领域相关的问题时，我们应当承认 GPT “理解”了这些知识

未完待续

在较低的标准下，我们应该承认 GPT “理解”目标领域的知识，承认 GPT “理解”自身的输出。但是人类对于“理解”还有更高层次的标准。比如学以致用、举一反三、活学活用、触类旁通等等的说法。显然这些行为不是靠超强的记忆和搜索就能做到的。所以关于“理解”究竟是什么，我们仅仅回答了一半。我会在后续的文章中进一步分析如何让 AI 拥有更高标准的“理解”能力

玄机博客

1.本站内容仅供参考，不作为任何法律依据。用户在使用本站内容时，应自行判断其真实性、准确性和完整性，并承担相应风险。

2.本站部分内容来源于互联网，仅用于交流学习研究知识，若侵犯了您的合法权益，请及时邮件或站内私信与本站联系，我们将尽快予以处理。

3.本文采用知识共享署名4.0国际许可协议 [BY-NC-SA] 进行授权

4.根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理，通过安装、显示、传输或者存储软件等方式使用软件的，可以不经软件著作权人许可，不向其支付报酬。”您需知晓本站所有内容资源均来源于网络，仅供用户交流学习与研究使用，版权归属原版权方所有，版权争议与本站无关，用户本人下载后不能用作商业或非法用途，需在24个小时之内从您的电脑中彻底删除上述内容，否则后果均由用户承担责任；如果您访问和下载此文件，表示您同意只将此文件用于参考、学习而非其他用途，否则一切后果请您自行承担，如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。