Jean's Blog

一个专注软件测试开发技术的个人博客

0%

智能体与多智能体

智能体:AI的新范式

一、什么是智能体(Agent)

智能体是具备自主决策能力、能感知环境、主动采取行动达成目标的 AI 系统。

  • 和传统 AI 最大区别:传统 AI 大多被动接收指令、单次输出结果;
  • 智能体拥有思考→行动→观察的闭环循环,能在动态变化的环境里,持续调整、优化自己的决策,更像 “会自主做事的数字个体”。

二、智能体的四大核心能力(四大系统协同)

智能体的核心优势,来自 4 种能力配合,让 AI 从被动应答,变成主动解决问题的智能实体

1. 感知能力(感官系统)

相当于智能体的眼睛、耳朵,用来理解复杂环境信息,能处理文本、图片、语音等多类型输入。

举例:智能会议助手,同时识别语音、PPT 内容、参会者状态,自动生成完整会议报告。

2. 执行能力(行动系统)

把思考后的决策,落地成实际操作,比如生成内容、调用工具、输出图文等。

举例:智能金融分析师,自动抓取市场数据、做风险评估,输出分析报告和可视化图表。

3. 记忆能力(存储系统)

分层存储信息,分为短期记忆、长期记忆、情节记忆、语义记忆,高效调取历史信息。

举例:个人旅行助手,记住你的出行偏好、历史对话,定制专属旅行方案。

4. 思考规划能力(大脑系统)

负责逻辑推理、任务拆解、制定决策、自主学习,解决复杂多步骤问题。

举例:智能投资顾问,分析市场趋势、制定策略,还能根据市场变化动态调整方案。

三、智能体的核心价值

核心定位一句话:把 AI 从被动回答,升级为主动解决问题的系统,实现真正的自动化智能

传统 AI 需要人一步步下达指令,而智能体可以自主拆解任务、自主调用工具、自主迭代方案,实现端到端自动完成复杂工作。

单智能体核心架构

单智能体是感知→决策→行动→循环迭代的闭环,4 个模块流程:

  1. 感知模块:接收环境信息(用户提问、工具返回结果等)
  2. 决策模块:基于当前状态 & 目标,判断下一步做什么
  3. 行动模块:执行决策,调用工具 / 输出回答
  4. 循环迭代:行动结果传回感知模块,持续循环优化
flowchart TD
    A[感知模块
接收用户输入、工具返回等环境信息] --> B[决策模块
基于状态和目标,决定下一步行动] B --> C[行动模块
执行决策,调用工具或生成响应] C --> D[循环迭代
结果反馈至感知模块,持续学习适应] D --> A

示例代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
# 1. 导入依赖库
from operator import imod
# 创建智能体核心函数
from langchain.agents import create_agent
# 初始化大模型
from langchain.chat_models import init_chat_model
# 人类消息格式
from langchain.messages import HumanMessage
# 工具装饰器
from langchain.tools import tool

# 2. 自定义工具:查询天气
@tool
def get_weather(location: str):
"""
获取指定位置的天气信息
参数:
location (str): 要查询天气的地点
返回:
dict: 包含地点和天气描述的字典
"""
return {"location": location, "天气": "明媚"}

# 3. 初始化大模型(DeepSeek,兼容OpenAI接口)
model = init_chat_model(
"deepseek-chat", # 模型名称
model_provider="openai", # 使用OpenAI兼容接口
api_key="模型的apikey", # 你的密钥
base_url="https://api.deepseek.com", # 接口地址
temperature=0.7, # 随机性:0精准~1发散
timeout=30, max_tokens=1000
)

# 4. 创建智能体:绑定模型、工具、人设
agent = create_agent(
model=model,
tools=[get_weather], # 绑定自定义天气工具
system_prompt="你是一个乐于助人的助手"
)

# 5. 调用智能体,提问
result = agent.invoke({
"messages": [
HumanMessage("广州天气怎么样?")
]
})

# 6. 打印最终回答
print(result["messages"][-1].content)
  1. 自定义工具get_weather),让 AI 具备查天气的能力
  2. 初始化DeepSeek 大模型作为智能体大脑
  3. create_agent绑定模型 + 工具,创建可自主调用工具的智能体
  4. 用户提问后,智能体自主判断需要调用天气工具→执行→返回结果,完成闭环

多智能体协作:1+1>2的力量

一、多智能体系统的 4 大核心优势

多个智能体协同工作,相比单个智能体能力大幅升级:

  1. 分工协作

    每个智能体专精一个领域(如一个查数据、一个写文案、一个做总结),各司其职,整体效率更高。

  2. 负载均衡

    任务拆分后分布式处理,不会出现单个 AI 算力瓶颈、卡顿,适合大规模复杂任务。

  3. 容错性强

    某一个智能体故障、出错,不会让整个系统瘫痪,系统稳定性更强。

  4. 持续学习

智能体之间可以共享经验、知识,互相学习,整体能力共同进化迭代。

二、3 种主流多智能体协作模式

根据任务复杂度,分为 3 种组织架构:

  1. 主从模式

    • 结构:1 个主控智能体 + 多个专业智能体,主控分配任务、统筹结果

    • 适用:任务拆分清晰、流程固定的场景,例如项目拆解、流程化工作

       flowchart TD
        A[主控智能体
    统筹、分配任务、汇总结果] --> B[专业智能体1
    专项执行] A --> C[专业智能体2
    专项执行] A --> D[专业智能体3
    专项执行] B --> A C --> A D --> A
  1. 对等模式

    • 结构:所有智能体地位平等,互相协商、沟通、博弈,共同完成目标

    • 适用:复杂、动态、需要多方讨论的场景,例如市场分析、多方决策

       flowchart LR
        A[智能体A] <--> B[智能体B]
        B <--> C[智能体C]
        A <--> C
  1. 层次模式

    • 结构:按功能分层,上层智能体统筹、下层智能体执行,逐级管理

    • 适用:超大规模复杂系统,例如企业级 AI 系统、大型自动化平台

       flowchart TD
        A[顶层智能体
    全局统筹] --> B[中层智能体1
    模块协调] A --> C[中层智能体2
    模块协调] B --> D[底层智能体1
    执行任务] B --> E[底层智能体2
    执行任务] C --> F[底层智能体3
    执行任务] C --> G[底层智能体4
    执行任务]

三、3 种多智能体通信机制(智能体之间怎么 “对话”)

通信方式 核心特点 适用场景
直接消息传递 点对点直接收发消息,延迟低、速度快 简单协作、少量智能体交互
共享黑板 统一公共信息区,所有智能体读写共享信息 复杂任务、需要全局信息同步
发布‑订阅 按主题异步通信,智能体订阅感兴趣的消息 大规模分布式系统、海量智能体

通俗总结

  • 单智能体 = 一个全能打工人,单打独斗;
  • 多智能体 = 一个AI 团队,有人分工、有人统筹、互相沟通,实现 1+1>2,解决更复杂的现实问题。

示例代码:使用DeepAgents构建多智能体系统

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
from deepagents import create_deep_agent
from langchain.chat_models import init_chat_model
from langchain.tools import tool
from deepagents.backends import FilesystemBackend

model = init_chat_model(
"deepseek-chat",
model_provider="openai", # 指定使用OpenAI兼容的API
api_key="模型的apikey",
base_url="https://api.deepseek.com",
temperature=0.7, timeout=30, max_tokens=1000
)

@tool
def get_weather(city: str) -> str:
"""
Get the weather for a given city.

Args:
city: The name of the city to get the weather for.

Returns:
A string describing the weather in the city.
"""
return f"The weather in {city} is sunny with a temperature of 25°C."

agent = create_deep_agent(
model=model,
backend=FilesystemBackend(root_dir="D://fortest", virtual_mode=True),
subagents=[
{
"name":"weather_agent",
"description":"用于查询城市天气",
"system_prompt":"你是一个专业的天气查询助手,你可以查询任何城市的天气,并以幽默的方式回答用户的问题。",
"tools":[get_weather]
}
],
system_prompt="""你是用户的私人助理,全权管理用户的所有请求。"""
)

result = agent.invoke({"messages": [{"role": "user", "content": r"今天北京天气怎么样?这个信息保存到 /weather.txt"}]}) #使用虚拟路径格式,DeepAgents不支持Windows绝对路径
print(result["messages"])
  1. 整体功能

    使用 DeepAgents 框架 搭建多智能体系统,实现主智能体 + 子智能体的协作模式,完成「查询天气 + 文件保存」任务。

  2. 核心模块拆解

    1. 模型初始化

      接入 DeepSeek 大模型,兼容 OpenAI 接口格式,配置基础参数。

    2. 自定义工具

      实现get_weather天气查询工具,模拟返回城市天气结果。

    3. 多智能体构建(主从模式)

      • 主智能体*:私人助理,统一接收用户请求、分配任务;
      • 子智能体 weather_agent:专职天气查询,绑定天气工具,有专属人设提示词。
    4. 文件存储后端

      使用FilesystemBackend文件系统后端,开启虚拟路径模式,将查询结果保存到虚拟文件weather.txt

    5. 执行流程

      用户提问 → 主智能体识别需求 → 调度天气子智能体查询天气 → 自动保存结果 → 返回最终回答。

  3. 关键要点

    • 采用主从式多智能体架构,分工明确;

    • 支持文件读写,实现结果持久化;

    • 必须使用虚拟路径,不支持 Windows 绝对路径。

DeepAgents 多智能体三大核心能力

一、智能路由(任务自动精准分配)

核心概念

DeepAgents 会读取每个子智能体的 description(功能描述),自动判断用户需求,匹配最合适的子智能体,不用人工手动调度,实现任务精准分发。

示例代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
subagents=[
{
"name":"weather_agent",
"description":"用于查询城市天气",
"system_prompt": "你是一个专业的天气查询助手",
"tools":[get_weather]
},
{
"name":"search_agent",
"description":"用于搜索网络信息",
"system_prompt": "你是一个专业的网络搜索助手",
"tools":[search_tool]
}
]

通俗理解

用户问天气 → 自动匹配weather_agent;用户查资讯 → 自动匹配search_agent

二、工具集成(为不同智能体配置专属工具)

核心概念

每个子智能体可以绑定独立专属工具集,实现能力差异化:天气智能体只用天气工具,搜索智能体只用搜索工具,分工明确、互不干扰。

示例代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
@tool
def get_weather(city: str) -> str:
"""获取指定城市的天气信息"""
return f"{city} 天气晴朗,25℃"

@tool
def search_tool(query: str) -> str:
"""搜索网络信息"""
return f"关于{query}的搜索结果"

# 为不同智能体配置不同工具
subagents=[
{
"name":"weather_agent",
"tools":[get_weather]
},
{
"name":"search_agent",
"tools":[search_tool]
}
]

通俗理解

给不同 AI “打工人” 配备专属技能,天气助手只会查天气,搜索助手只会搜信息。

三、动态协作(多智能体协同完成复杂任务)

核心概念

多个子智能体自动配合串联工作,一个任务需要多步操作时,自动调用对应智能体依次执行。

示例:查天气 → 写入文件,需要天气智能体 + 文件智能体协同完成。

示例代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
agent = create_deep_agent(
model=model,
backend=FilesystemBackend(root_dir="D://fortest", virtual_mode=True),
subagents=[
{
"name":"weather_agent",
"description":"用于查询城市天气",
"tools":[get_weather]
},
{
"name":"file_agent",
"description":"用于文件读写操作",
"tools":[write_file, read_file]
}
],
system_prompt="你是用户的私人助理,全权管理用户的所有请求"
)

# 多智能体协作完成任务:查天气 + 保存文件
result = agent.invoke({"messages": [{"role": "user", "content": "今天北京天气怎样?这个信息保存到 /weather.txt"}]})

通俗理解

主助理收到指令 → 派天气助手查天气 → 派文件助手写入文档,自动串联完成完整工作流

整体总结

  1. 智能路由:解决 “找谁干活”,自动匹配对应智能体
  2. 工具集成:解决 “会干什么活”,每个智能体绑定专属工具
  3. 动态协作:解决 “怎么一起干活”,多智能体自动配合完成复杂任务

三者结合,就是 DeepAgents 实现主从式多智能体系统的核心底层逻辑。

多智能体系统的应用场景

应用领域 核心定位 具体落地场景
企业自动化 构建跨部门协作的智能工作流,自动化处理复杂业务流程 1. 客户服务自动化
2. 数据分析与报告生成
3. 项目管理与协调
教育领域 创建个性化学习环境,提供定制化教育体验 1. 智能辅导系统
2. 个性化学习路径
3. 自动作业批改
医疗健康 辅助医疗诊断和治疗,提高医疗服务质量 1. 多学科诊断协作
2. 患者监护系统
3. 药物研发加速
科研领域 加速科学研究进程,促进跨学科合作 1. 文献分析与综述
2. 实验设计与优化
3. 数据建模与仿真
电商零售 提升客户体验和运营效率,优化销售流程 1. 智能推荐系统
2. 客户需求分析
3. 供应链优化
智慧城市 优化城市管理,提升公共服务质量 1. 交通流量优化
2. 能源管理系统
3. 应急响应协调

智能体技术的未来发展

一、技术趋势(未来智能体的三大发展方向)

发展方向 核心说明
更智能的决策能力 结合强化学习、因果推理技术,让智能体的逻辑判断、自主决策更精准,减少错误决策
开放环境适应性 提升智能体在陌生、动态、未知环境里的适应能力,系统稳定性(鲁棒性)更强,不用局限在固定场景
人机协同增强 打造更自然、高效的AI 与人协作模式,智能体辅助人类工作,而非单纯替代

二、挑战与机遇

1. 现存挑战(落地难点)

  1. 智能体间的协调与信任:多智能体协作时,容易出现沟通冲突、任务推诿、目标不一致,难以建立稳定协作关系
  2. 复杂系统的可解释性:多智能体决策链路复杂,出问题时难以追溯原因,黑盒问题严重
  3. 伦理与安全问题:自主决策可能带来隐私泄露、算法偏见、安全风险
  4. 大规模部署的成本:搭建大量智能体算力、维护系统,成本高昂

2. 发展机遇(商业 & 社会价值)

  1. 产业数字化转型的催化剂:帮助企业自动化业务,加速全行业数字化升级
  2. 新的商业模式和服务:催生 AI 数字员工、智能管家、自动化服务等新业态
  3. 科学研究的加速工具:助力科研数据分析、实验模拟,大幅缩短科研周期
  4. 社会问题的创新解决方案:用于智慧城市、医疗健康、应急管理,解决公共治理难题

通俗总结

未来智能体,会变得更会思考、适应力更强、更懂和人配合

但当下要解决协作、安全、成本、可解释性等难题;

一旦突破,将全面赋能企业、科研、社会治理,带来全新商业模式。

总结

一、核心定位:智能体是 AI 的下一次革命

智能体(单智能体自主决策 → 多智能体协同工作)是当前 AI 技术的核心革新方向:

  • 突破了传统 AI被动问答、单次输出的局限;
  • 扩展了 AI 能力边界,能够解决企业、科研、城市治理等复杂现实问题

二、两大主流开发框架(分工清晰、互补使用)

  1. LangChain 1.2

    侧重单智能体开发,实现简单高效,适合搭建独立、自主完成任务的单个 AI 智能体。

  2. DeepAgents

    侧重多智能体系统开发,擅长实现多个智能体分工协作、动态配合。

  3. 最佳实践:两者结合,可快速搭建高效、可扩展的智能体解决方案。

三、未来展望:全面落地,赋能各行业

智能体系统将大规模普及到各行各业:

  • 覆盖场景:企业自动化、科研、教育、医疗、智慧城市、电商零售等;
  • 未来形态:更智能、协作能力更强;
  • 最终定位:成为人类解决复杂问题的重要 AI 伙伴