多智能体架构概述

侧伴的核心创新是多智能体系统(Multi-Agent System)。不同于传统的单一AI助手,侧伴包含多个角色智能体,模拟真实课堂的复杂情境。

为什么需要多智能体?

单智能体的局限

传统AI助手(如ChatGPT)是单智能体:

  • 只有一种角色(问答者)
  • 无法模拟课堂多人互动
  • 用户只能被动接收

多智能体的优势

侧伴的多智能体:

  • 多种角色:教师、同学、辩论者
  • 多人互动:模拟真实课堂讨论
  • 主动参与:用户深度参与互动

三类核心智能体

教师智能体

角色定位:专业、权威、耐心

核心能力

  • 讲解知识点(分章节、渐进式)
  • 回答问题(即时答疑)
  • 提供例题(巩固理解)
  • 调整节奏(根据用户反馈)

教学方法:采用苏格拉底式教学,通过提问引导思考,而非简单灌输。

同学智能体

角色定位:好奇、活跃、友善

核心能力

  • 提出问题(激发讨论)
  • 参与讨论(碰撞观点)
  • 协作学习(模拟同伴)
  • 鼓励支持(情感陪伴)

设计理念:研究表明,社会性学习效果更好。AI同学解决了在线学习「没人陪伴」的问题。

辩论智能体

角色定位:批判、质疑、逻辑严密

核心能力

  • 提出反对观点
  • 逻辑反驳
  • 证据质疑
  • 激发深度思考

触发场景:涉及争议话题时,辩论智能体参与圆桌辩论。

协作决策机制

任务分配

当用户开始学习时,系统会:

  1. 解析文档内容
  2. 识别适合讲解的知识点 → 分配给教师智能体
  3. 识别适合讨论的话题 → 分配给同学智能体
  4. 识别争议点 → 分配给辩论智能体

信息共享

智能体之间共享课堂状态:

  • 当前讲解进度
  • 用户理解程度(基于回答正确率)
  • 用户情绪反馈

冲突协调

当智能体意见冲突时:

  • 辩论场景:保持对立,激发思考
  • 教学场景:教师智能体权威决策
  • 协作场景:民主讨论,用户参与决策

LLM驱动机制

大语言模型

每个智能体都由大语言模型(LLM)驱动:

  • 自然语言理解:理解用户问题、文档内容
  • 自然语言生成:生成讲解、提问、回答
  • 上下文记忆:记住对话历史,保持连贯性

角色扮演

通过Prompt Engineering实现角色扮演:

  • 教师智能体:「你是专业、权威、耐心的AI教师...」
  • 同学智能体:「你是好奇、活跃、友善的AI同学...」
  • 辩论智能体:「你是批判、质疑、逻辑严密的辩论者...」

技术实现

架构设计

  • Agent Manager:管理所有智能体生命周期
  • Task Dispatcher:任务分配调度器
  • Context Sharing:共享上下文存储
  • Conflict Resolver:冲突协调器

数据流

  1. 用户上传文档
  2. 系统解析文档 → 提取知识点
  3. Agent Manager初始化三类智能体
  4. Task Dispatcher分配任务
  5. 智能体执行任务,生成内容
  6. Context Sharing更新状态
  7. 用户接收内容,提供反馈
  8. 智能体根据反馈调整行为

白板生成算法

白板绘图由可视化生成算法完成:

  • 识别适合可视化的知识点(流程、结构、关系)
  • 生成图表类型决策(流程图/概念图/树形图)
  • 调用绘图引擎渲染
  • 同步展示到虚拟白板

语音合成技术

语音讲解采用语音合成(TTS)

  • LLM生成讲解文本
  • TTS引擎转换为语音
  • 不同智能体使用不同语音风格
  • 实时语音流播放

开源实现

侧伴的架构已开源,地址:GitHub: OpenMAIC

开发者可以:

  • 查看详细架构设计
  • 理解协作决策机制
  • 贡献新的智能体角色
  • 优化LLM调用策略

总结

多智能体架构是侧伴的核心创新,让AI教育从「单一问答」进化到「多角色互动」,真正模拟真实课堂的学习体验。

技术驱动,让学习更智能。