知识的量子态
在回答什么是“理解”之前,我们先来讨论一下知识和其载体的定义。知识本身是一个抽象的概念,它可以被编码到各种物质载体中。无论是纸质书籍,还是人类大脑中的神经连接,抑或是服务器中的0和1,都可以看作是知识的载体。知识与其载体之间存在着一种特殊的关系——知识可以完整地存在于一个载体中,也可以分布在多个载体中。
假设冯诺伊曼的计算机模型知识在全世界共有100亿份拷贝,无论是书本还是人脑。如果我们逐个销毁这些载体,当最后一份载体被销毁时,这项知识是否还存在?答案应该是不存在了。那么在什么时刻,这项知识开始“消失”的?事实上,在整个过程中,这项知识的状态可以视为不变,直到最后一个载体消失的一瞬间,知识才发生了“量子跃迁”,从存在变为不存在。知识与其载体之间呈现出一种量子关系,知识要么完整存在,要么完全不复存在,并不存在中间状态。并且基于哲学上部分与整体的关系,即使一个知识基于其完整性被保留了80%,但是事实上做为整体的那个知识,也已经不存在了。
进入信息时代后,知识的载体已经从纸质书籍逐渐向电子化格式转变。海量知识被数字编码,可以进行近乎无限的复制。这使得知识的“量子态”变得更加稳定。以维基百科为例,它记录了大量人类知识,拥有超过6000万条词条,資料量超过100TB。它的内容分布在全球数万台服务器上,实时互联互通。就算某几台服务器损坏,也不会对整体知识造成损失。类似的,GPT 模型吸收了互联网上数百亿条文本数据,对人类知识进行了有效的“数字化编码”。理论上,只要保持模型的完整,即便断网也不会导致已编码知识的丢失。这使得知识的“量子态”得到了前所未有的保障。
载体是否理解知识
在《神雕侠侣》中,杨过被赵志敬要求背诵《全真大道歌》,最后能流利地对答。但实际上杨过对其中的内涵一无所知,除了能回答问题,对于武功一窍不通。我们绝不会认为此时的杨过理解了全真教的武功心法。人脑的记忆系统使我们可以存储大量信息,成为知识的容器。但理解知识还需要将信息进行逻辑推理、关联组合,这是另一个层次的认知过程。所以人类既可以是知识的载体,像图书馆一样丰富知识内容;也可以不理解自身所载知识,像杨过那样死记硬背。充分理解知识需要更高层次的思维能力,不仅停留在存储和重复。
在社会招聘时,面试官通过提问来判断应聘者是否理解某项知识。如果应聘者只是死记硬背,但是刚巧所有问题都能对答如流,那么面试官将很难辨别真伪。在论文答辩时也有着类似的场景。这意味着以人类社会为基础建立起来的关于“理解”的评估标准,对于具有超级记忆能力和已经学会流畅人类语言交流的 GPT 模型而言是不合适的。对于 GPT 模型而言,人类所谓的“理解”实际上是个派生概念,人类标准下的“理解”,在广义上可以是“记忆”加“向量搜索”的同义词。
因此我们可以得到推论:简单的记忆和搜索对于人类而言可以认为是初步的“理解”,能做到有逻辑得回答目标领域的相关问题。那么我们应该基于这个推论承认目前的 GPT 模型初步具有了“理解”的能力。当它可以流畅得回答特定领域相关的问题时,我们应当承认 GPT “理解”了这些知识
未完待续
在较低的标准下,我们应该承认 GPT “理解”目标领域的知识,承认 GPT “理解”自身的输出。但是人类对于“理解”还有更高层次的标准。比如学以致用、举一反三、活学活用、触类旁通等等的说法。显然这些行为不是靠超强的记忆和搜索就能做到的。所以关于“理解”究竟是什么,我们仅仅回答了一半。我会在后续的文章中进一步分析如何让 AI 拥有更高标准的“理解”能力
1.本站内容仅供参考,不作为任何法律依据。用户在使用本站内容时,应自行判断其真实性、准确性和完整性,并承担相应风险。
2.本站部分内容来源于互联网,仅用于交流学习研究知识,若侵犯了您的合法权益,请及时邮件或站内私信与本站联系,我们将尽快予以处理。
3.本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
4.根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。”您需知晓本站所有内容资源均来源于网络,仅供用户交流学习与研究使用,版权归属原版权方所有,版权争议与本站无关,用户本人下载后不能用作商业或非法用途,需在24个小时之内从您的电脑中彻底删除上述内容,否则后果均由用户承担责任;如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
5.本站是非经营性个人站点,所有软件信息均来自网络,所有资源仅供学习参考研究目的,并不贩卖软件,不存在任何商业目的及用途
暂无评论内容