2025.02.14

LLM，强大和脆弱，皆源于其本质

LLM，其强大和脆弱，皆源于其本质。

它的本质决定了它必然会有“幻觉”，这种的“幻觉”，是药还是毒，取决于你用它做什么。

一个人的照片，反映了在某一时刻的某一面，但它与人的全部面向和能力相比，还是九牛一毛。

大模型像是一张巨大的照片，它能反映人类认知模式当中的某些特质，但相距人类意识世界的复杂度全部，只是冰山上的一角而已。更不用谈人类集体意识和智慧的涌现，这更是当今任何技术都难以企及的。

大语言模型（LLM）的本质，是一种文字概率的模式压缩映射系统。这种工具通过统计模型来模拟理解语言文字，预测内容。

LLM的输出是训练语料库的概率性混合，它通过自注意力机制重组文本碎片，涌现出非常靠谱的“知识”。同时，来自数据间低频模式的重新加权和组合，也会衍生出创造性的“幻觉”。

从技术角度而言，LLM统计文字在数学向量之间的距离，通过逐词预测逼近语言真实分布。LLM背后神经元网络的架构，相当于一个压缩的“文本宇宙”，存储了文字语言数据中的“模式”。

现在几千亿参数规模的模型，凝聚了人类已有的巨量的知识和经验。人工智能呈现了某种“自主性”的特征，是源于对文字语言数据高频模式的萃取，例如回答“太阳东升西落的原因”时，它没有理解天体物理，而是总结复现科普文本中的常见解释模式。

即便如此，LLM用“概率真理”替代“逻辑真理”，这在诸多领域是一种伟大的角度，是伟大的技术实践。

这样的技术，在解算数学、构建代码、创作文章等方面表现出卓越的性能。人们不仅可以利用LLM解决某类问题，构建知识，也可以构建解决问题的工具，这是LLM技术的伟大之处，例如编写各种各样的程序，或者调用web上的服务工具。

大模型的本身知识空间仍是陈旧的、静态的。人们将大模型与互联网的信息连接起来，拓展了大模型的价值。将参数化知识和计算能力与外部数据协同，这将大模型的价值放大了百倍千倍。

尽管如此，在大模型理解现实世界和物理空间方面，仍然有很大局限性。

人作为最有创造力的个体，依然扮演着无法替代的作用。人的感知能力，行动力，情感体验，审美，道德观念，价值观念，灵性的追求，爱与自由，这些超越其他生物的特质，仍旧是任何技术无法模仿的，更是难以超越的。

大模型这种人类技术进步，作为工具而言，会发挥巨大的生产力，已经绽放出各种各样的可能性。

LLM的强大极其脆弱皆源于其本质。它的本质决定了它的“幻觉”，这种“幻觉”是药还是毒，取决于你用它做什么。

文字语言是LLM基底，也是其枷锁。理解这一本质，对LLM去魅，不必对其有过度拟人化期待。重要的是，当你发现生活中的痛点问题，用LLM的来尝试，或许会有迥然不同的可能性。

** 扩展阅读 **

AI推理的反馈对于用户心理影响

AI Agent与传统软件产品到底有哪些不同？

有6种提示语，让你的AI对话飞起来

AI大模型反映了什么？

DeepSeek万能提问公式大揭秘

“DeepSeek什么是你不擅长的？”

大模型的局限性六个方面

来源：XT

本文所属主题：向死而生、认知与思维枢纽 →

相关文章