LLM,强大和脆弱,皆源于其本质

LLM,其强大和脆弱,皆源于其本质。
它的本质决定了它必然会有“幻觉”,这种的“幻觉”,是药还是毒,取决于你用它做什么。
一个人的照片,反映了在某一时刻的某一面,但它与人的全部面向和能力相比,还是九牛一毛。
大模型像是一张巨大的照片,它能反映人类认知模式当中的某些特质,但相距人类意识世界的复杂度全部,只是冰山上的一角而已。更不用谈人类集体意识和智慧的涌现,这更是当今任何技术都难以企及的。
大语言模型(LLM)的本质,是一种文字概率的模式压缩映射系统。这种工具通过统计模型来模拟理解语言文字,预测内容。
LLM的输出是训练语料库的概率性混合,它通过自注意力机制重组文本碎片,涌现出非常靠谱的“知识”。同时,来自数据间低频模式的重新加权和组合,也会衍生出创造性的“幻觉”。
从技术角度而言,LLM统计文字在数学向量之间的距离,通过逐词预测逼近语言真实分布。LLM背后神经元网络的架构,相当于一个压缩的“文本宇宙”,存储了文字语言数据中的“模式”。
现在几千亿参数规模的模型,凝聚了人类已有的巨量的知识和经验。人工智能呈现了某种“自主性”的特征,是源于对文字语言数据高频模式的萃取,例如回答“太阳东升西落的原因”时,它没有理解天体物理,而是总结复现科普文本中的常见解释模式。
即便如此,LLM用“概率真理”替代“逻辑真理”,这在诸多领域是一种伟大的角度,是伟大的技术实践。
这样的技术,在解算数学、构建代码、创作文章等方面表现出卓越的性能。人们不仅可以利用LLM解决某类问题,构建知识,也可以构建解决问题的工具,这是LLM技术的伟大之处,例如编写各种各样的程序,或者调用web上的服务工具。
大模型的本身知识空间仍是陈旧的、静态的。人们将大模型与互联网的信息连接起来,拓展了大模型的价值。将参数化知识和计算能力与外部数据协同,这将大模型的价值放大了百倍千倍。
尽管如此,在大模型理解现实世界和物理空间方面,仍然有很大局限性。
人作为最有创造力的个体,依然扮演着无法替代的作用。人的感知能力,行动力,情感体验,审美,道德观念,价值观念,灵性的追求,爱与自由,这些超越其他生物的特质,仍旧是任何技术无法模仿的,更是难以超越的。
大模型这种人类技术进步,作为工具而言,会发挥巨大的生产力,已经绽放出各种各样的可能性。
LLM的强大极其脆弱皆源于其本质。它的本质决定了它的“幻觉”,这种“幻觉”是药还是毒,取决于你用它做什么。
文字语言是LLM基底,也是其枷锁。理解这一本质,对LLM去魅,不必对其有过度拟人化期待。重要的是,当你发现生活中的痛点问题,用LLM的来尝试,或许会有迥然不同的可能性。
** 扩展阅读 **
AI推理的反馈对于用户心理影响
AI Agent与传统软件产品到底有哪些不同?
有6种提示语,让你的AI对话飞起来
AI大模型反映了什么?
DeepSeek万能提问公式大揭秘
“DeepSeek什么是你不擅长的?”
大模型的局限性六个方面
最新!山姆·奥特曼的三个观察
原文链接:https://mp.weixin.qq.com/s/Ype8zNFPrnzKNZfWfJnFwg
来源:XT