维度之美

AI 是如何通过几何学“理解”世界的?

当你问大语言模型(LLM)“男人之于国王相当于女人之于什么”时,它能迅速回答出“女王”。 这背后并不是因为它背下了字典,而是因为它将文字转化成了一个高维空间里的坐标

1. 什么是语义嵌入 (Embedding)?

在 AI 的世界里,每个词都是一个由成百上千个数字组成的序列。这些数字定义了该词在空间里的位置。 相似含义的词,在空间里的距离就越近。

交互体验:语义引力场

点击下方画布任意位置,模拟搜索一个“新概念”。你会发现系统会自动向最接近的已有概念“塌缩”。

{{ c.name }}
你的搜索: {{ nearestConcept }}

2. 意义的加减法

最神奇的部分在于,这个空间具有代数性质。 如果我们把“男人”到“国王”的位移看作是一个“地位增加”的向量,那么把这个向量加在“女人”身上, 终点指向的坐标恰好就是“女王”。

概念实验室:语义计算器

+
{{ calcA }} - {{ calcB }} + {{ calcC }} = {{ resultConcept }}

这就是为什么 AI 能够通过类比来理解新事物。

3. 结语

理解了向量空间,你就理解了神经网络的灵魂。 世界不再是孤立的符号,而是相互关联、可以被数学计算的流动。下一次当你调优 Prompt 时,试着去想:你正在将 AI 的注意力推向空间的哪个角落?