Open Source MIT License

AI驱动
智能桌面自动化系统

SAUOS 通过大语言模型和视觉理解能力,让计算机像人一样"看"屏幕、"理解"界面、"执行"操作。 用自然语言控制一切,告别繁琐的脚本编写。

SAUOS Web UI

核心能力

让AI成为你的数字员工

👁️

视觉理解

实时截屏分析,精准识别UI元素、文本内容、按钮位置,理解屏幕上的一切。

🧠

智能决策

基于大语言模型的任务规划,自动分解复杂操作步骤,像人一样思考和执行。

🖱️

精准操控

鼠标点击/拖拽、键盘输入、热键组合、窗口管理,完整的系统级操作能力。

🔄

多模型支持

OpenAI、Claude、阿里百炼、DeepSeek等8+大模型一键切换,灵活适配不同场景。

🏠

私有部署

支持Ollama本地模型,数据不出企业内网,满足最严格的安全合规要求。

🌐

Web界面

可视化操作界面,实时预览屏幕,查看AI分析结果,监控任务执行状态。

系统架构

三层架构,模块化设计

用户界面层
Web UI (Flask)
CLI
API
AI 智能层
Vision
LLM (8+ Models)
AI Agent
Config
自动化核心层
Screen
Mouse
Keyboard
Window
Image

支持的 AI 模型

统一接口,一键切换

OpenAI

GPT-4o / GPT-4-turbo

Claude

claude-3.5-sonnet

Alibaba

qwen-max / qwen-vl

DeepSeek

deepseek-chat

Zhipu AI

glm-4

MiniMax

abab6.5s-chat

Volcano

doubao-pro

Moonshot

moonshot-v1-8k

Ollama

本地私有部署

快速开始

三步启动你的AI助手

# 1. 克隆项目
git clone https://github.com/sauos-dev/sauos-aient.git
cd sauos-aient

# 2. 安装依赖
pip install -r requirements.txt

# 3. 启动服务
python web.py    # Web UI http://localhost:5678
python run.py    # CLI

开源共建

SAUOS 采用 MIT 协议开源,欢迎社区贡献代码、提交Issue、分享使用经验。让我们一起打造最好用的AI自动化工具。

Star on GitHub
8+
支持模型
100%
Python
MIT
开源协议