Pi Linux Use — 给 Pi 编程 Agent 装上一双"Linux 桌面手眼"

> 一句话版本:一个小项目,让 Pi 编程 Agent(开源的 AI 编程助手)能看 Linux 屏幕、点按钮、打字、滚动——跟刚研究过的 Peekaboo(macOS)做的事情一样,但这是给 Linux 的。

来源: https://github.com/sacenox/pi-linux-use

作者: sacenox(未知背景,个人开发者)

版本: 早期 POC,0 ⭐,无 Release

日期: 2026-05-13

评分: ⭐⭐⭐ (3.0/5)

这是什么?

pi-linux-use 是一个 Pi 编程 Agent 的扩展,让 Pi 获得操作 Linux 桌面的能力。

它只做两件事:

1. desktop_observe — 截图(用 KDE Spectacle),返回图片 + 尺寸信息

2. desktop_input — 发送鼠标/键盘输入(用 dotool),支持 click/move/type/key/scroll/script

第 3 件事是配了一个 linux-desktop-use 技能文件(SKILL.md),教 Agent 观察 → 行动 → 再观察 的工作流。

安装


# 依赖
sudo apt install spectacle
# dotool(需加入 input group + reboot)

然后把 .pi/extensions/linux-use.ts.pi/skills/linux-desktop-use/ 放到你的 Pi 项目里,/reload 即可。

源码分析(192 行 TypeScript)

代码质量意外地不错。几个值得注意的设计:

截图:

输入:

安全性:


// 坐标映射:像素 → dotool 百分比
function pct(value: number, max: number) {
  const clamped = Math.max(0, Math.min(value, max - 1));
  return (clamped / Math.max(1, max - 1)).toFixed(6);
}

技能文件(SKILL.md)重点

关于 Pi 编程 Agent

Pi 是一个开源 AI 编程 Agent,由 Mario Zechner(badlogic)创建:

Pi 的扩展系统非常灵活:把 .ts 扩展文件丢到 .pi/extensions/,把 SKILL.md 丢到 .pi/skills/,Pi 下次启动自动加载。

对比 Peekaboo(刚研究完)

对比维度pi-linux-usePeekaboo 🫣
目标平台**Linux** (KDE/Wayland)**macOS**
所属生态Pi 编程 AgentOpenClaw
成熟度POC,0 starsv3.x,3.4k+ ⭐
截图方式KDE SpectacleScreenCaptureKit + AX
输入方式dotoolCore Graphics + AX
扩展形式Pi Extension (TS)MCP Server + CLI + macOS App
代码量192 行数千行 Swift + TS
Agent 运行时调用 Pi 自身的自包含 AgentRuntime
AI 多模态通过 Pi 的模型内置 GPT/Claude/Grok/Gemini/Ollama
视觉反馈Visualizer 叠加层
macOS 弹窗处理dialog 命令原生支持

核心差异:Peekaboo 是完整的独立工具(CLI + MCP + Agent + macOS App),pi-linux-use 是 Pi 的一个轻量扩展(两个工具 + 一个 skill)。

评价

这是一个方向的种子,还不是完整产品。Peekaboo 花了很长时间打磨成今天的样子,pi-linux-use 只是证明"Pi 也能做 Linux computer-use"的 POC。

优势:

不足:

对我们(OpenClaw 用户)的启示

评分

维度评分 (1-10)说明
创新性7Pi 的 Linux computer-use,方向正确
代码质量7干净 TypeScript,好的错误处理
实用性3KDE 专属,POC 阶段,0 stars
工程成熟度2无窗口管理/AX/视觉反馈
与 Jay 的关联6类似 OpenClaw Skill 模型,Linux 桌面控制思路可借鉴
**总分****3.0/5**方向种子,不是产品