AI 开发核心术语表

掌握这些概念,读懂 AI 技术文档不再困难。

RAG 架构

Retrieval-Augmented Generation(检索增强生成)。一种结合了检索系统和生成式模型的技术。它先从外部知识库中检索相关信息,然后作为上下文提供给 LLM,以生成更准确、更新的回答。

Agent (智能体) 核心

具有感知、规划和行动能力的 AI 系统。与普通的 Chatbot 不同,Agent 可以使用工具(如搜索、计算器、API)来自主完成复杂任务。

Embedding (向量) 数据

将文本、图像等数据转换成的高维数值向量。在多维空间中,语义相似的内容距离更近。这是向量数据库进行语义搜索的基础。

Prompt Engineering 技巧

提示工程。设计和优化输入给 AI 模型的文本提示(Prompt),以引导模型生成更准确、高质量输出的技术。包括 Zero-shot, Few-shot, CoT 等策略。

LLM 模型

Large Language Model(大语言模型)。经过海量文本数据训练的深度学习模型,具备理解和生成自然语言的能力。代表作有 GPT-4, Llama 3, Claude 3。

Vector Database 数据

向量数据库。专门用于存储和检索 Embedding 向量的数据库。支持高效的相似性搜索(KNN/ANN)。常见工具有 Chroma, Milvus, Qdrant。

Fine-tuning (微调) 训练

在预训练模型的基础上,使用特定领域的数据进行进一步训练,以提升模型在该领域的表现。比从头训练(Pre-training)成本低得多。

CoT (思维链) 技巧

Chain of Thought。一种 Prompt 技巧,通过让模型展示“思考过程”(Step-by-step),显著提高模型解决复杂逻辑、数学问题的能力。

Token 基础

模型处理文本的基本单位。由字符或单词片段组成。通常 1000 个 Token 约等于 750 个英文单词或 500 个汉字。

Temperature 参数

控制模型输出随机性的参数。值越低(如 0.2),输出越确定、严谨;值越高(如 0.8),输出越随机、有创造力。

更多术语持续收录中...