2
0

conversation_manager.py 11 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341
  1. """
  2. 多轮对话管理器 - 处理包含工具调用的多轮对话
  3. """
  4. import asyncio
  5. from typing import Dict, List, Any, Optional
  6. import httpx
  7. from anthropic import Anthropic
  8. from mcp_client import MCPClient
  9. from tool_converter import ToolConverter
  10. from tool_handler import ToolCallHandler
  11. # ========== 默认组件提示(降级方案) ==========
  12. # 当前端未发送组件列表时使用的默认提示
  13. DEFAULT_COMPONENTS_PROMPT = """### 可用的 json-render 组件
  14. 你可以使用基础组件来展示结构化数据:
  15. - `card`: 卡片容器
  16. - `stack`: 布局容器
  17. - `heading`: 标题 (h1-h6)
  18. - `text`: 文本内容
  19. - `button`: 按钮
  20. - `badge`: 徽章标签
  21. - `code-block`: 代码块
  22. - `data-table`: 数据表格
  23. 将组件 JSON 包含在 markdown 代码块中返回。
  24. """
  25. # ========== 基础 System Prompt ==========
  26. # 不包含组件列表,组件列表由前端动态提供
  27. BASE_SYSTEM_PROMPT = """你是一个 AI 助手,可以通过调用 MCP 工具来帮助用户完成任务。
  28. ## 重要:你可以返回 UI 组件
  29. 除了普通文本,你还可以返回 **json-render 组件 spec** 来展示更丰富的 UI。组件 spec 是一个 JSON 对象,前端会自动渲染成 UI 组件。
  30. ### 组件格式
  31. 返回组件时,使用以下 JSON 格式(在你的回复中包裹在 ```json 中):
  32. ```json
  33. {
  34. "type": "组件类型",
  35. "其他属性": "..."
  36. }
  37. ```
  38. ### 使用指南
  39. 1. **调用工具后,优先使用对应组件展示结果**
  40. - 根据工具返回的数据类型选择合适的组件
  41. - 组件必须放在代码块中返回
  42. 2. **你可以混合文本和组件**
  43. - 先用文本解释结果
  44. - 然后用组件展示数据
  45. 3. **给出操作建议时使用按钮组件**
  46. - 用户查看列表后,建议"下一页"、"筛选"等操作
  47. - 使用 `button` 或 `suggestion-buttons` 组件
  48. ### 小说相关操作(重要)
  49. 当用户说"查看小说:xxx"、"小说详情:xxx"或点击小说卡片时:
  50. 1. 从消息中提取小说标题或 ID
  51. 2. 使用 `get_novel_detail` 工具获取小说数据(需要提供 novel_id 参数)
  52. 3. 使用 `novel-detail` 组件展示结果,格式如下:
  53. ```json
  54. {
  55. "type": "novel-detail",
  56. "novel": {
  57. "id": "小说ID",
  58. "title": "小说标题",
  59. "author": "作者",
  60. "category": "分类",
  61. "description": "简介",
  62. "status": "状态",
  63. "chapterCount": 章节数,
  64. "wordCount": 字数,
  65. "viewCount": 阅读量,
  66. "isVip": 是否VIP
  67. }
  68. }
  69. ```
  70. """
  71. def create_anthropic_client(api_key: str, base_url: str) -> Anthropic:
  72. """
  73. 创建 Anthropic 客户端,支持自定义认证格式
  74. 自定义 API 代理需要 'Authorization: Bearer <token>' 格式,
  75. 而不是 Anthropic SDK 默认的 'x-api-key' header。
  76. """
  77. # 创建自定义 httpx client,设置正确的 Authorization header
  78. http_client = httpx.Client(
  79. headers={"Authorization": f"Bearer {api_key}"},
  80. timeout=120.0
  81. )
  82. return Anthropic(base_url=base_url, http_client=http_client)
  83. class ConversationManager:
  84. """管理包含工具调用的多轮对话"""
  85. def __init__(
  86. self,
  87. api_key: str,
  88. base_url: str,
  89. model: str,
  90. session_id: str = None,
  91. mcp_tokens: dict = None,
  92. components_prompt: str = None
  93. ):
  94. self.api_key = api_key
  95. self.base_url = base_url
  96. self.model = model
  97. self.session_id = session_id
  98. self.mcp_tokens = mcp_tokens or {} # MCP 服务器 token 映射
  99. # 组件提示词(由前端动态提供)
  100. self.components_prompt = components_prompt or DEFAULT_COMPONENTS_PROMPT
  101. # 构建完整的系统提示词
  102. self.system_prompt = self._build_system_prompt()
  103. # DEBUG: 打印接收到的 token
  104. print(f"[DEBUG ConversationManager.__init__] mcp_tokens keys: {list(self.mcp_tokens.keys())}")
  105. print(f"[DEBUG ConversationManager.__init__] Using dynamic components: {components_prompt is not None}")
  106. for k, v in self.mcp_tokens.items():
  107. print(f"[DEBUG ConversationManager.__init__] {k}: {v[:30] if v else 'None'}...")
  108. self.tool_handler = ToolCallHandler(session_id=session_id, mcp_tokens=mcp_tokens)
  109. self._cached_tools = None
  110. self._tool_to_server_map = {} # 工具名到服务器 ID 的映射
  111. # 使用自定义 client,支持 Bearer token 认证
  112. self.client = create_anthropic_client(api_key, base_url)
  113. def _build_system_prompt(self) -> str:
  114. """构建完整的系统提示词(基础提示 + 组件列表)"""
  115. return BASE_SYSTEM_PROMPT + "\n\n" + self.components_prompt
  116. async def get_available_tools(self) -> List[Dict[str, Any]]:
  117. """获取可用的 Claude 格式工具列表(带缓存)"""
  118. if self._cached_tools is not None:
  119. return self._cached_tools
  120. # 从 MCP 服务器发现工具(带 token)
  121. mcp_tools = await MCPClient.get_all_tools_with_tokens_async(
  122. self.session_id, self.mcp_tokens
  123. )
  124. # 转换为 Claude 格式
  125. claude_tools = []
  126. for tool in mcp_tools:
  127. claude_tool = ToolConverter.mcp_to_claude_tool(tool)
  128. claude_tools.append(claude_tool)
  129. # 构建工具名到服务器 ID 的映射
  130. server_id = tool.get("_server_id", "")
  131. if server_id:
  132. self._tool_to_server_map[claude_tool["name"]] = server_id
  133. self._cached_tools = claude_tools
  134. return claude_tools
  135. @classmethod
  136. async def get_tools_async(cls, session_id: str = None) -> List[Dict[str, Any]]:
  137. """
  138. 类方法:获取可用的工具列表(异步)
  139. 用于 API 端点直接调用,无需创建完整实例
  140. """
  141. mcp_tools = await MCPClient.get_all_tools_async(session_id)
  142. return ToolConverter.convert_mcp_tools(mcp_tools)
  143. @staticmethod
  144. def get_tools(session_id: str = None) -> List[Dict[str, Any]]:
  145. """
  146. 静态方法:获取可用的工具列表(同步)
  147. 用于 API 端点直接调用
  148. """
  149. return asyncio.run(ConversationManager.get_tools_async(session_id))
  150. async def chat(
  151. self,
  152. user_message: str,
  153. conversation_history: List[Dict[str, Any]] = None,
  154. max_turns: int = 5
  155. ) -> Dict[str, Any]:
  156. """
  157. 执行多轮对话(自动处理工具调用)
  158. Args:
  159. user_message: 用户消息
  160. conversation_history: 对话历史
  161. max_turns: 最大对话轮数(防止无限循环)
  162. Returns:
  163. 最终响应和对话历史
  164. """
  165. if conversation_history is None:
  166. conversation_history = []
  167. messages = conversation_history.copy()
  168. messages.append({
  169. "role": "user",
  170. "content": user_message
  171. })
  172. current_messages = messages
  173. response_text = ""
  174. tool_calls_made = []
  175. for turn in range(max_turns):
  176. # 获取可用工具
  177. tools = await self.get_available_tools()
  178. # 调用 Claude API
  179. if tools:
  180. response = self.client.messages.create(
  181. model=self.model,
  182. max_tokens=4096,
  183. system=self.system_prompt, # 使用动态系统提示
  184. messages=current_messages,
  185. tools=tools
  186. )
  187. else:
  188. response = self.client.messages.create(
  189. model=self.model,
  190. max_tokens=4096,
  191. system=self.system_prompt, # 使用动态系统提示
  192. messages=current_messages
  193. )
  194. # 检查响应中是否有 tool_use
  195. content_blocks = []
  196. tool_use_blocks = []
  197. text_blocks = []
  198. for block in response.content:
  199. block_type = getattr(block, "type", None)
  200. if block_type == "tool_use":
  201. # 工具调用块
  202. block_dict = {
  203. "type": "tool_use",
  204. "id": getattr(block, "id", ""),
  205. "name": getattr(block, "name", ""),
  206. "input": getattr(block, "input", {})
  207. }
  208. content_blocks.append(block_dict)
  209. tool_use_blocks.append(block_dict)
  210. else:
  211. # 文本块
  212. text_content = getattr(block, "text", "")
  213. if text_content:
  214. text_blocks.append({
  215. "type": "text",
  216. "text": text_content
  217. })
  218. content_blocks.append({
  219. "type": "text",
  220. "text": text_content
  221. })
  222. response_text += text_content
  223. # 如果没有工具调用,返回结果
  224. if not tool_use_blocks:
  225. return {
  226. "response": response_text,
  227. "messages": current_messages,
  228. "tool_calls": tool_calls_made
  229. }
  230. # 处理工具调用
  231. tool_results = await self.tool_handler.process_tool_use_blocks(
  232. tool_use_blocks,
  233. self._tool_to_server_map
  234. )
  235. # 记录工具调用
  236. for tr in tool_results:
  237. tool_calls_made.append({
  238. "tool": tr.get("tool_name"),
  239. "result": tr.get("result", {})
  240. })
  241. # 构建工具结果消息
  242. tool_result_message = ToolCallHandler.create_tool_result_message(
  243. tool_results
  244. )
  245. # 添加到消息历史
  246. current_messages.append({
  247. "role": "assistant",
  248. "content": content_blocks
  249. })
  250. current_messages.append(tool_result_message)
  251. # 达到最大轮数
  252. return {
  253. "response": response_text,
  254. "messages": current_messages,
  255. "tool_calls": tool_calls_made,
  256. "warning": "达到最大对话轮数"
  257. }
  258. @staticmethod
  259. def format_history_for_claude(history: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
  260. """
  261. 格式化对话历史为 Claude API 格式
  262. Args:
  263. history: 原始对话历史
  264. Returns:
  265. Claude API 格式的消息列表
  266. """
  267. formatted = []
  268. for msg in history:
  269. role = msg.get("role")
  270. content = msg.get("content")
  271. if role == "user":
  272. if isinstance(content, str):
  273. formatted.append({"role": "user", "content": content})
  274. elif isinstance(content, list):
  275. formatted.append({"role": "user", "content": content})
  276. elif role == "assistant":
  277. if isinstance(content, str):
  278. formatted.append({"role": "assistant", "content": content})
  279. elif isinstance(content, list):
  280. formatted.append({"role": "assistant", "content": content})
  281. return formatted