AI 术语表 (Glossary) - OA AI编程实战

RAG 架构

Retrieval-Augmented Generation（检索增强生成）。一种结合了检索系统和生成式模型的技术。它先从外部知识库中检索相关信息，然后作为上下文提供给 LLM，以生成更准确、更新的回答。

Agent (智能体) 核心

具有感知、规划和行动能力的 AI 系统。与普通的 Chatbot 不同，Agent 可以使用工具（如搜索、计算器、API）来自主完成复杂任务。

Embedding (向量) 数据

将文本、图像等数据转换成的高维数值向量。在多维空间中，语义相似的内容距离更近。这是向量数据库进行语义搜索的基础。

Prompt Engineering 技巧

提示工程。设计和优化输入给 AI 模型的文本提示（Prompt），以引导模型生成更准确、高质量输出的技术。包括 Zero-shot, Few-shot, CoT 等策略。

LLM 模型

Large Language Model（大语言模型）。经过海量文本数据训练的深度学习模型，具备理解和生成自然语言的能力。代表作有 GPT-4, Llama 3, Claude 3。

Vector Database 数据

向量数据库。专门用于存储和检索 Embedding 向量的数据库。支持高效的相似性搜索（KNN/ANN）。常见工具有 Chroma, Milvus, Qdrant。

Fine-tuning (微调) 训练

在预训练模型的基础上，使用特定领域的数据进行进一步训练，以提升模型在该领域的表现。比从头训练（Pre-training）成本低得多。

CoT (思维链) 技巧

Chain of Thought。一种 Prompt 技巧，通过让模型展示“思考过程”（Step-by-step），显著提高模型解决复杂逻辑、数学问题的能力。

Token 基础

模型处理文本的基本单位。由字符或单词片段组成。通常 1000 个 Token 约等于 750 个英文单词或 500 个汉字。

Temperature 参数

控制模型输出随机性的参数。值越低（如 0.2），输出越确定、严谨；值越高（如 0.8），输出越随机、有创造力。

AI 开发核心术语表