一、基础核心术语
| 术语 | 解释 |
|---|---|
| LLM (大语言模型) | 基于海量文本训练的对话引擎,本质是概率预测下一个词的超大规模统计工具 |
| SLM (小语言模型) | 强调低成本与本地化部署的精简版本 |
| Agent (智能体/AI Agent) | 能理解目标、调用工具、分步执行任务的智能系统 |
| 多模态 | 处理文本、图像、语音等多种输入融合能力 |
| Token | AI模型处理与计费的基本单位 |
| 上下文窗口 | 模型单次处理能"记住"的Token总量 |
二、技术架构与训练
| 术语 | 解释 |
|---|---|
| Transformer | LLM基石架构,通过自注意力机制突破长文本瓶颈 |
| MoE (混合专家模型) | 动态激活专家模块降耗增效,GPT-4关键技术 |
| RAG (检索增强生成) | 用外部知识提高回答准确性,解决幻觉问题 |
| 微调 (Fine-tuning) | 用领域数据优化预训练模型 |
| 蒸馏 (Distillation) | 大模型能力迁移到小模型 |
| RLHF | 基于人类反馈的强化学习,ChatGPT对齐核心 |
三、2025-2026年热点概念
| 术语 | 解释 |
|---|---|
| Vibe Coding (氛围编程) | 用大白话描述需求,AI直接生成代码。2025年柯林斯词典年度词汇 |
| Agentic Workflow | 系统不再一问一答,而是自主拆解任务、调用外部能力 |
| MCP (模型上下文协议) | 大模型与外部工具/数据源的标准连接层 |
| A2A (Agent to Agent) | 代理之间任务交接与跨系统协作 |
| 具身智能 | AI+机器人,让AI具备物理身体感知能力 |
| 推理模型 | 具备慢思考与自我纠错能力的模型 |
| 长上下文 | 几十万字文档一次性处理能力 |
四、热门产品与公司
| 名称 | 特点 |
|---|---|
| DeepSeek | 2025年最火中国AI,557万美元训练成本比肩OpenAI |
| ChatGPT | 全球最大AI应用,周活超8亿 |
| Claude | 主打复杂智能体任务和长时程工作 |
| Gemini | Google原生植入Chrome的多模态模型 |
| Kimi | "长文本之王",能读几十万字文档 |
| 通义千问 | 阿里AI,7天下载量破1000万 |
| 豆包 | 字节跳动,央视春晚合作 |
五、行业趋势词
| 术语 | 解释 |
|---|---|
| 开源大模型 | 代码公开免费使用,打破闭源垄断 |
| AI垃圾 | AI生成的低质量内容污染训练数据 |
| 幻觉 (Hallucination) | AI"胡说八道"的现象 |
| AI Native | 以AI为核心重构的产品形态 |
| 算力经济 | GPU成为新"石油"的底层竞争 |
| 端侧AI | AI在手机等设备离线运行 |


发表评论