WyseOS
首页Python SDK用户手册
WyseOS

Introduction

📖 文档📜 核心概念

Users

📋 用户手册

Developers

🚀 Python SDK

Changelogs

Others

联系我们

📖 文档

欢迎访问WyseOS文档站!

WyseOS 是一个突破性的多智能体网页自动化系统,精心设计用于协调任务规划、感知、记忆和行动等多个专家智能体的运作。作为一个智能操作系统(AgentOS),它使智能体能够通过自然语言理解用户意图,协同分解复杂任务,并在动态网页环境中自主实现目标。

我们的愿景:智能体的实践应用

WyseOS 致力于实现具备以下能力的智能体系统:

  • 自主网页导航:智能体能像人类一样自然地与网页和数字界面进行交互。
  • 复杂任务分解:将复杂的用户需求分解为一系列可管理的、目标导向的子任务。
  • 大语言模型驱动决策:利用先进的大语言模型(LLMs)在任务执行过程中进行智能推理和决策。
  • 上下文记忆:维持持久的任务上下文记忆,实现多步骤之间的自适应和连贯交互。
  • 真实环境适应性:能够动态适应DOM变化、处理网络延迟、从局部故障中恢复,并应对其他现实环境的复杂性。

核心架构组件

WyseOS 基于先进的多智能体框架构建,实现高效的智能体协作。系统包括:

  • 任务规划智能体:核心协调者,负责理解高层用户目标,制定动态计划,并通过调度专家智能体来协调执行流程。
  • 专家智能体:执行具体自动化操作的功能单元,这些智能体从知识库中检索相关信息,并使用封装的控制工具集进行精确操作。

关键技术优势

WyseOS 的核心优势包括以下先进特性:

  • 混合页面元素检测:结合了视觉检测(使用在网页截图上微调的YOLO-v12模型)和DOM语义检测(遍历文档对象模型寻找可交互元素)。智能的信息融合策略确保了在动态网页环境中的稳健和通用元素检测。
  • 持续更新的知识库:集成了持续进化的**检索增强生成(RAG)**知识库,为智能体提供即时信息访问。包括官方帮助文档和历史自动化案例的经验学习,实现终身学习并不断提高任务成功率。
  • 云浏览器与本地扩展协同:使用隔离的云端沙箱浏览器进行并发任务执行。对于身份认证等复杂场景,轻量级的本地浏览器插件安全地弥补了传统云浏览器的局限性。
  • 模块化SDK扩展:提供全面的软件开发工具包(SDK),包含标准化接口和智能体注册流程,使第三方开发者能够轻松集成自定义业务逻辑、专有模型或现有组件作为新的专家智能体。

为什么选择WyseOS?开启自动化新范式

WyseOS 代表着向更智能、更适应性强、更用户友好的网页自动化系统的重要跨越。它使智能体能够以最少的再训练或硬编码规则解决新问题,实现跨领域自动化。用户只需声明目标,智能体就能自主理解并完成任务。

实时网页感知、强大的上下文记忆和自适应推理的整合,使WyseOS能够在持续的闭环反馈中运行。这一关键能力使智能体能够持续运作、在需要时寻求澄清、提供及时更新,并优雅地从错误中恢复,展现出与人类助手相媲美的效率和响应能力。

📜 核心概念

下一页

目录

我们的愿景:智能体的实践应用
核心架构组件
关键技术优势
为什么选择WyseOS?开启自动化新范式