LLM 相关概念

Function Call(函数调用)

Function Call 指 LLM 在生成自然语言之外,还能按约定输出结构化数据(常见为 JSON),用来表示「要调用哪个外部函数、参数是什么」。借此可以把模型输出接到代码、HTTP API、数据库、脚本等,实现与真实系统的交互。

多数云厂商与开源栈会把它和 JSON Schema(或等价描述)绑定:先声明工具名与参数类型,模型只负责在合法集合里做选择并填参;真正执行仍由宿主程序完成。这是许多「工具使用 / Tool Use」方案的底层能力,Agent、MCP 等往往都建立在这层之上。

Agent

Agent 一般指 LLM + 工具 + 记忆 + 编排逻辑 构成的智能体:不局限于单次问答,而是能在多步里推理 → 选工具 → 执行 → 根据结果再推理,直到任务结束或达到终止条件。

与「只聊天」的用法相比,Agent 强调闭环:模型决定下一步动作,环境返回观测结果,再进入下一轮。记忆可以是会话摘要、向量检索、键值存储等形式,视产品而定。

MCP(Model Context Protocol)

MCPopen in new window 是一套开放协议,用来把「工具、资源、提示」等能力以标准方式暴露给支持 MCP 的客户端(如部分 IDE、桌面应用)。实现上常见为本地或远程进程,通过约定好的传输层与宿主通信。

对模型侧而言,MCP 服务会提供能力声明:有哪些工具、每个工具的参数与说明。宿主在启动或连接时会拉取这份声明;用户提问时,模型在需要时发起工具调用,由 MCP 执行并返回结果,再用于生成最终回复。可以理解为:把一类集成方式标准化,便于同一套 MCP 被多个宿主复用。

Skill(技能)

Skill 常指可复用的技能说明:不限于「可调用的 API」,也可以描述规范、流程、约定、检查清单等。形式上多为 Markdown 等文档,开头常有摘要,正文展开细节与示例。

与 Agent 结合时,典型做法是:先只把各 Skill 的摘要注入上下文,让模型知道「有哪些技能」;当判断某条用户任务匹配某一 Skill 时,再按需加载该 Skill 全文,并按文档约束调整行为(例如优先用某类工具、遵守某套步骤)。这和单纯堆长提示词的区别在于:分层加载,节省上下文并减少干扰。