基于 AutoGLM-Phone-9B 的手机端智能助理部署项目,支持通过自然语言指令自动操作 Android 设备完成各种任务。
本项目集成了 Open-AutoGLM 框架和 AutoGLM-Phone-9B 模型,提供了一键部署和管理工具。Phone Agent 能够:
/workspace/ ├── models/ │ ├── AutoGLM-Phone-9B/ # AutoGLM-Phone-9B 模型目录(下载后生成) │ └── Open-GLM/ # Open-AutoGLM Agent 代码(下载后生成) ├── run.sh # 部署和管理脚本 ├── README.md # 本文档 └── .cnb.yml # Cloud Native Build 配置
使用 run.sh 命令
# 下载模型初始环境
./run.sh setup
# 启动模型服务(如因GPU资源分配问题启动失败需显存24GB+,可重新启动或关闭环境后重新打开)
./run.sh start
# 安装并配置 Agent 虚拟环境
./run.sh venv
mkdir -p /workspace/models
cd /workspace/models
git clone https://cnb.cool/ai-models/zai-org/AutoGLM-Phone-9B
使用 Docker vLLM 部署模型:
docker run --gpus all --rm \
-v /workspace/models:/workspace/models \
-p 8000:8000 vllm/vllm-openai:v0.12.0 \
--gpu-memory-utilization 0.56 \
--served-model-name autoglm-phone-9b \
--allowed-local-media-path / \
--mm-encoder-tp-mode data \
--mm_processor_cache_type shm \
--mm_processor_kwargs "{\"max_pixels\":5000000}" \
--max-model-len 25480 \
--chat-template-content-format string \
--limit-mm-per-prompt "{\"image\":10}" \
--model /workspace/models/AutoGLM-Phone-9B \
--port 8000
# 克隆 Open-GLM 代码仓库
cd /workspace/models
git clone https://cnb.cool/jacknic-lab/zai-org/Open-AutoGLM /workspace/models/Open-GLM
# 创建虚拟环境
cd /workspace/models/Open-GLM
python3 -m venv venv
# 激活虚拟环境并安装依赖
source venv/bin/activate
pip install -r requirements.txt
开启开发者模式
设置 → 关于手机 → 版本号启用 USB 调试
设置 → 开发者选项 → USB 调试USB 调试(安全设置)安装 ADB Keyboard
wget https://github.com/senzhk/ADBKeyBoard/raw/refs/heads/master/ADBKeyboard.apk adb install ADBKeyboard.apk
设置 → 语言和输入法 中启用连接设备
# 使用 USB 数据线连接手机
adb devices
# 应显示设备列表,如:
# List of devices attached
# XXXXXXXX device
设置 → 系统和更新 → 开发者选项)hdc list targets
source /workspace/models/Open-GLM/venv/bin/activate
python /workspace/models/Open-GLM/main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b"
source /workspace/models/Open-GLM/venv/bin/activate
python /workspace/models/Open-GLM/main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b" "打开美团搜索附近的火锅店"
查看完整列表:
# Android
python /workspace/models/Open-GLM/main.py --list-apps
# 鸿蒙
python /workspace/models/Open-GLM/main.py --device-type hdc --list-apps
Agent 可执行以下操作:
| 操作 | 描述 |
|---|---|
Launch | 启动应用 |
Tap | 点击指定坐标 |
Type | 输入文本 |
Swipe | 滑动屏幕 |
Back | 返回上一页 |
Home | 返回桌面 |
Long Press | 长按 |
Double Tap | 双击 |
Wait | 等待页面加载 |
Take_over | 请求人工接管(登录/验证码等) |
个人PC端:连接手机后启动TCP转发, 此时本机的 5555 端就是手机的adb连接端口
adb tcpip 5555 adb forward tcp:5555 tcp:5555
个人PC端:安装好 WebStorm ,将本地端口转发到云端



python /workspace/models/Open-GLM/main.py --base-url http://localhost:8000/v1 --model "autoglm-phone-9b" "打开抖音刷视频"
adb kill-server adb start-server adb devices
检查:
确保同时开启: