2025/02/14 · 2 分钟

LLM,强大和脆弱,皆源于其本质

哲思AI方法论

LLM,其强大和脆弱,皆源于其本质。

它的本质决定了它必然会有“幻觉”,这种的“幻觉”,是药还是毒,取决于你用它做什么。

一个人的照片,反映了在某一时刻的某一面,但它与人的全部面向和能力相比,还是九牛一毛。

大模型像是一张巨大的照片,它能反映人类认知模式当中的某些特质,但相距人类意识世界的复杂度全部,只是冰山上的一角而已。更不用谈人类集体意识和智慧的涌现,这更是当今任何技术都难以企及的。

大语言模型(LLM)的本质,是一种文字概率的模式压缩映射系统。这种工具通过统计模型来模拟理解语言文字,预测内容。

LLM的输出是训练语料库的概率性混合,它通过自注意力机制重组文本碎片,涌现出非常靠谱的“知识”。同时,来自数据间低频模式的重新加权和组合,也会衍生出创造性的“幻觉”。

从技术角度而言,LLM统计文字在数学向量之间的距离,通过逐词预测逼近语言真实分布。LLM背后神经元网络的架构,相当于一个压缩的“文本宇宙”,存储了文字语言数据中的“模式”。

现在几千亿参数规模的模型,凝聚了人类已有的巨量的知识和经验。人工智能呈现了某种“自主性”的特征,是源于对文字语言数据高频模式的萃取,例如回答“太阳东升西落的原因”时,它没有理解天体物理,而是总结复现科普文本中的常见解释模式。

即便如此,LLM用“概率真理”替代“逻辑真理”,这在诸多领域是一种伟大的角度,是伟大的技术实践。

这样的技术,在解算数学、构建代码、创作文章等方面表现出卓越的性能。人们不仅可以利用LLM解决某类问题,构建知识,也可以构建解决问题的工具,这是LLM技术的伟大之处,例如编写各种各样的程序,或者调用web上的服务工具。

大模型的本身知识空间仍是陈旧的、静态的。人们将大模型与互联网的信息连接起来,拓展了大模型的价值。将参数化知识和计算能力与外部数据协同,这将大模型的价值放大了百倍千倍。

尽管如此,在大模型理解现实世界和物理空间方面,仍然有很大局限性。

人作为最有创造力的个体,依然扮演着无法替代的作用。人的感知能力,行动力,情感体验,审美,道德观念,价值观念,灵性的追求,爱与自由,这些超越其他生物的特质,仍旧是任何技术无法模仿的,更是难以超越的。

大模型这种人类技术进步,作为工具而言,会发挥巨大的生产力,已经绽放出各种各样的可能性。

LLM的强大极其脆弱皆源于其本质。它的本质决定了它的“幻觉”,这种“幻觉”是药还是毒,取决于你用它做什么。

文字语言是LLM基底,也是其枷锁。理解这一本质,对LLM去魅,不必对其有过度拟人化期待。重要的是,当你发现生活中的痛点问题,用LLM的来尝试,或许会有迥然不同的可能性。

** 扩展阅读 **

AI推理的反馈对于用户心理影响

AI Agent与传统软件产品到底有哪些不同?

有6种提示语,让你的AI对话飞起来

AI大模型反映了什么?

DeepSeek万能提问公式大揭秘

“DeepSeek什么是你不擅长的?”

大模型的局限性六个方面

最新!山姆·奥特曼的三个观察


原文链接:https://mp.weixin.qq.com/s/Ype8zNFPrnzKNZfWfJnFwg

来源:XT

转发给可能用得上的朋友
LLM,强大和脆弱,皆源于其本质 · xtblog