SAUOS 通过大语言模型和视觉理解能力,让计算机像人一样"看"屏幕、"理解"界面、"执行"操作。 用自然语言控制一切,告别繁琐的脚本编写。
让AI成为你的数字员工
实时截屏分析,精准识别UI元素、文本内容、按钮位置,理解屏幕上的一切。
基于大语言模型的任务规划,自动分解复杂操作步骤,像人一样思考和执行。
鼠标点击/拖拽、键盘输入、热键组合、窗口管理,完整的系统级操作能力。
OpenAI、Claude、阿里百炼、DeepSeek等8+大模型一键切换,灵活适配不同场景。
支持Ollama本地模型,数据不出企业内网,满足最严格的安全合规要求。
可视化操作界面,实时预览屏幕,查看AI分析结果,监控任务执行状态。
三层架构,模块化设计
统一接口,一键切换
GPT-4o / GPT-4-turbo
claude-3.5-sonnet
qwen-max / qwen-vl
deepseek-chat
glm-4
abab6.5s-chat
doubao-pro
moonshot-v1-8k
本地私有部署
三步启动你的AI助手
SAUOS 采用 MIT 协议开源,欢迎社区贡献代码、提交Issue、分享使用经验。让我们一起打造最好用的AI自动化工具。
Star on GitHub