从零到专家

67个AI词汇彻底搞懂(建议收藏)

你有没有过这种体验:朋友兴冲冲讲起AI,满嘴"Token""Agent""Temperature",你只能一边点头一边心虚?

这篇文章,就是为了终结这种尴尬而写的。

我把AI领域最核心的词汇,按"从普通人到专家"分成7个难度层级,每一层用最直白的语言讲清楚。不管你是完全小白,还是已经在用AI工具的进阶用户,都能在这里找到你需要的那一层。

Lv 1 · 零基础 / 产品界面

第一层不需要任何基础,只要你用过手机就能懂。

NO.01 AI(人工智能)

不是会思考的机器人,更像一个极其复杂的"预测机器"——根据你输入的内容,预测最合理的回应。现在说的AI,基本上就是指大语言模型。

NO.02 Chatbox(聊天框)

就是你和AI对话的输入框。Claude、ChatGPT、文心一言里打字的地方,都叫Chatbox。没什么神秘的,它是人与AI交互的唯一入口。

NO.03 输入 / 输出

你打进去的叫输入,AI回给你的叫输出。整个AI交互最底层的逻辑就是这两个词。

NO.04 联网搜索

大多数AI的知识有截止日期,开启联网搜索后,AI能实时查网络,回答今天的新闻、最新政策、刚发生的事情。

NO.05 对话历史

AI在同一个窗口里能记住你们聊过的话。但关掉窗口重开,它就"失忆"了——每次新对话都是全新开始。

Lv 2 · 入门 / 使用基础

这一层是用好AI的基本姿势。懂了这些,你就从"偶尔用用"变成"真的会用"。

NO.06 Prompt(提示词)

你给AI的任务说明。"说得越清楚,做得越准。"好的Prompt是AI时代最被低估的技能。同样是让AI写文章,"帮我写篇文章"和"你是财经编辑,为中小企业主写一篇800字现金流管理指南"——结果天差地别。

NO.07 模型

AI背后真正干活的那个"大脑"。Claude、GPT、Gemini都是不同的模型,能力和性格各不一样。

NO.08 AIGC

AI Generated Content,AI生成内容。以前只有人能创作的东西,现在AI也能生成。这一轮AI热潮的起点,就是AIGC的爆发。

NO.09 上下文

AI在当前对话中能"看见"的信息总量。你之前说的所有话,都是AI理解你当前问题的上下文。上下文越长,AI越能抓住重点。

NO.10 多模态

能同时处理文字、图片、音频、视频等多种输入形式的模型。以前的AI只能"看字",现在的AI能"看图说话""听音理解"。

NO.11 模型版本

同一家公司的模型也分新旧。数字越大越新,能力通常也越强——Claude 4比Claude 3聪明,就是这个意思。

NO.12 模型类型

有的专处理文字,有的能看图,有的能生成视频。不同任务用不同模型,不是一个打天下。

NO.13 Markdown

用符号标记格式的写法。# 是标题,** 是加粗。AI默认用Markdown回答你,很多产品会自动渲染好——所以你看到的是整洁的排版,而不是一堆符号。

NO.14 AI 应用

把AI能力包装成产品的那一层。你用的各种AI工具,都是AI应用。底层的模型是引擎,应用是套在引擎外面让普通人能开的车。

NO.15 工作流(Workflow)

把多个AI步骤串联成流水线。A做完交给B,B做完交给C——自动跑完全程,不用每次手动操作。工作流是AI自动化的基础单元。

NO.16 System Prompt(系统提示词)

产品方预设的"角色说明",你看不见,但它始终影响AI的风格。同样的模型在不同产品里"性格"不一样,就是它在起作用。

Lv 3 · 入门+ / 模型理解

这一层开始涉及"AI怎么运作"的基本原理。懂了这些,你会知道AI为什么有时候很聪明、有时候又很蠢。

NO.17 LLM(大语言模型)

Large Language Model。通过在海量文字上训练学会理解和生成人类语言的模型。ChatGPT、Claude、Gemini都是LLM。

NO.18 幻觉(Hallucination)

AI一本正经地胡说八道——它会用非常确定的语气说出完全错误的信息。这是LLM最大的弱点,所以重要信息一定要自己核实。

NO.19 Token(词元)

AI处理文字的最小单位,也是计费单位。中文约每字1-2个Token。模型越强,Token越贵。

NO.20 上下文窗口

AI每次对话能处理的最大Token数量。超出这个范围的内容它就忘了。窗口越大,能处理的文档越长。

NO.21 Temperature(温度)

控制AI输出随机性的旋钮。调低——更稳定;调高——更发散。写作用高,做数据分析用低。

NO.22 RLHF(人类反馈强化学习)

Reinforcement Learning from Human Feedback。让人类标注员给AI的回答打分,用这些反馈来训练模型,让它更符合人类的偏好——决定了模型的"性格"。

NO.23 Embedding(词嵌入)

把文字转换成数字向量的技术。"猫"和"狗"的向量在空间里离得近,"猫"和"汽车"离得远。AI通过这种方式理解词语之间的关系。

NO.24 提示词工程(Prompt Engineering)

研究怎么问AI才能答得最好的学问。模型越来越强,对它的依赖在降低——但基本功还是值得学的。

NO.25 对齐(Alignment)

让AI的输出符合人类价值观和安全标准的过程。没有对齐的模型可能会说出有害、偏见或危险的内容。

NO.26 概率采样

AI不是"知道"答案,而是计算下一个词最可能是什么。Top-p 和 Top-k 就是控制它从概率分布中选词的两种方法。

NO.27 微调(Fine-tuning)

在预训练好的大模型基础上,用特定领域的数据再做一轮训练,让它更擅长某个专门任务。比从头训练省成本得多。

Lv 4 · 中级 / AI概念·自动化

这一层开始讲AI圈里经常听到的"大词",搞清楚这些,你就能看懂90%的AI新闻。

NO.28 AGI(通用人工智能)

能做任何人类能做的智力任务的AI。现在还没到,但硅谷所有人都在奔这个方向。

NO.29 涌现(Emergence)

模型大到某个临界点,突然会了一些没人教过的能力。这是AI能力飞跃的核心秘密——也是没人能完全解释的现象。

NO.30 Agent(智能体)

聊天机器人是"嘴巴",Agent是长了"手脚"的AI——能自主拆解任务、调用工具、把事情做完。你不只是在和它聊天,而是在指挥它行动。

NO.31 Vibe Coding

不懂代码,靠跟AI聊天来做出产品。门槛从"会编程"变成了"会表达"。这是2025年最火的新词之一。

NO.32 API(应用程序接口)

开发者调用AI能力的接口。如果说AI是餐厅,API就是后厨的取餐口——程序通过它点菜,拿到AI的回答,再整合进自己的产品。

NO.33 API Key

调用API时证明"是你"的密码串。泄露了别人就能用你的额度消费——像银行卡密码一样保管。

NO.34 推理(Reasoning)

AI做逻辑分析、数学推导的能力。推理能力强的模型,面对复杂问题不容易翻车。

NO.35 To B / To C

To B是卖给企业,客单价高、续费稳;To C是卖给个人,用户量大但很难让人持续付费。AI产品的商业路线,基本就在这两条路里选。

NO.36 AI Native

骨子里就是AI的产品,不是把传统软件用AI补丁打补丁,而是从零开始为AI时代设计的。

NO.37 RAG(检索增强生成)

Retrieval-Augmented Generation。让AI在回答前先检索相关知识库,再基于检索结果生成回答。解决了大模型知识过时和幻觉的问题。

NO.38 Transformer

2017年提出的神经网络架构,所有现代大语言模型的共同祖先。"Attention Is All You Need"那篇论文的标题已经成为AI史上最著名的句子之一。

NO.39 Agent框架

用于构建Agent的开发框架,如LangChain、AutoGen等。它们提供了工具调用、记忆管理、任务规划等基础设施,让开发者不用从零开始造轮子。

Lv 5 · 进阶 / 开发·AI工程

这一层开始接触开发者的基础工具和AI工程实践。就算你不想成为开发者,了解这些词也能让你和技术团队沟通时不掉队。

NO.40 GitHub

程序员存放和协作代码的平台。AI时代的开源圣地——很多AI工具的源代码都在这里。

NO.41 MCP(模型上下文协议)

Model Context Protocol。让AI模型与外部工具和数据源对接的标准协议。有了MCP,AI可以读取你的文件、数据库、日历——不用每次都手动复制粘贴。

NO.42 Debug / 调试

找出代码里哪里出问题了,然后修掉。Vibe Coding时AI能帮你Debug——但你得能看懂它在改什么,不然你不知道它改对没有。

NO.43 前端

你眼睛直接看到的部分——页面、按钮、动画。AI写代码最擅长的就是前端。

NO.44 后端

藏在页面背后处理逻辑、存储数据的部分。你看不见,但它决定了产品能不能用。

NO.45 HTML / CSS

HTML是网页的骨架语言,CSS是样式表。Vibe Coding时AI帮你生成的代码,很多就是HTML+CSS。你得能看懂它在改什么。

NO.46 版本控制

记录代码每次改动的历史,方便多人协作和回退。Git是最流行的版本控制系统,GitHub就是基于Git的代码托管平台。

NO.47 依赖管理

管理项目用到的第三方代码库(依赖)。npm、pip、requirements.txt都是干这个的——依赖乱了,项目就跑不起来。

NO.48 测试 / Test

验证代码有没有按预期工作。一定要测——你不测,你不知道AI写的代码在特殊情况下会不会崩。

NO.49 代码审查(Code Review)

让别人检查你的代码,发现潜在问题。AI时代,Code Review不仅给人看,也可以让AI帮你审——但人的判断依然不可替代。

Lv 6 · 开发者 / 系统·部署

这一层是把AI服务"跑起来"的关键。你写的代码、训练好的模型,最终都要部署到真实环境才能让所有人使用。

NO.50 Terminal(终端)

也叫命令行、Shell。不是点鼠标点图标,而是打字输入命令来操作电脑。开发者每天面对的黑底白字窗口,就是Terminal。

NO.51 环境变量

操作系统级别的全局配置变量。最典型的用途就是存放API Key、数据库密码等敏感信息——写在代码里会泄露,放在环境变量里更安全。

NO.52 服务器

一台24小时不间断运行的电脑,用来对外提供服务。你的AI应用最终要跑在服务器上,别人才能通过网络访问它。

NO.53 部署(Deploy)

把开发好的代码发布到服务器上的过程。部署之前代码只在你电脑上能跑,部署之后全世界都能访问它。

NO.54 容器(Docker)

把应用和它需要的环境打包成一个"集装箱",在任何机器上都能一致运行。解决了"我电脑上能跑,服务器上不行"的经典问题。

NO.55 域名(Domain)

互联网上网站的地址名称,比如google.com。IP地址是数字(142.250.x.x),人类记不住,域名就是好记的别名。

NO.56 端口(Port)

服务器上一个"房间号",不同端口对应不同服务。比如80端口默认给网站,3000端口常被开发服务器占用。访问时写成"域名:端口"。

Lv 7 · 专家 / 模型原理·硬件

这一层是真正的底层逻辑。不需要全懂,但知道这些词的意思,你看AI新闻会通透很多。

NO.57 神经网络

模仿人类大脑神经元设计的算法结构。现代AI的底层骨架——LLM就是一个超级巨大的神经网络。

NO.58 蒸馏(Distillation)

用大模型的输出来训练小模型,让小模型学到大模型的聪明劲。DeepSeek能做到低成本高水平,蒸馏技术是重要原因之一。

NO.59 GPU(图形处理器)

原本用来渲染游戏画面的芯片,后来发现特别适合并行矩阵运算——正是AI训练的核心计算。现在GPU比游戏还贵。

NO.60 算力

计算能力的总称。AI三要素之一,决定了你能训练多大的模型。现在顶级AI公司的核心壁垒之一就是能拿到多少GPU。

NO.61 预训练

在海量互联网文字上学习语言规律的阶段。烧钱最多、时间最长——顶级模型的预训练要花好几个月和几亿美元。

NO.62 后训练

预训练之后,让模型学会"好好说话"的阶段。通过人类反馈让它更对齐、更有用——决定了模型的"性格"。

NO.63 参数

神经网络里通过训练调整的数值。参数越多,模型越大、通常也越聪明——也越贵。你听到的"70亿参数""千亿参数",就是在说这个。

NO.64 注意力机制(Attention)

Transformer架构的核心。让模型在生成每个词时,"关注"输入中最相关的部分。没有Attention,就没有现代大语言模型。

NO.65 反向传播(Backpropagation)

神经网络学习的核心算法。通过计算输出误差对每个参数的影响,从后往前调整参数——就像老师批改作业后告诉你哪里做错了。

NO.66 损失函数(Loss Function)

衡量模型预测和正确答案之间差距的数学公式。训练的目标就是让损失函数越来越小——损失越小,模型越准。

NO.67 激活函数(Activation Function)

神经网络中决定神经元是否"激活"的数学函数。ReLU、Sigmoid、GELU都是常见的激活函数——没有它们,神经网络就只是线性回归。

总结

层级 主题 你能做什么
Lv1 零基础 产品界面 认识AI工具的基本组成
Lv2 入门 使用基础 真正会用AI,而不只是偶尔试试
Lv3 入门+ 模型理解 理解LLM为什么这样回答,能调教它
Lv4 中级 AI概念·自动化 看懂AI新闻,能用AI搭工作流
Lv5 进阶 开发·AI工程 Vibe Coding,动手做AI产品
Lv6 开发者 系统·部署 把AI服务跑起来,给别人用
Lv7 专家 模型原理·硬件 理解AI底层,能做模型层的判断

你现在在哪个层级?评论区告诉我。

如果这篇对你有用,转发给还在对AI术语一头雾水的朋友——让他们少走一些弯路。

本文整理了AI领域核心词汇,按7级难度分层。适合收藏反复查阅。