Back to Dev Diary

在边缘设备上部署 VLA 视语言动作模型的挑战

彭

彭俊豪

•Dev Diary•February 28, 2025

在边缘设备上部署 VLA 视语言动作模型的挑战

桌面级 AI 的算力悖论

当下的行业共识是“云端大脑”，但对于一台需要实时响应你桌面动作的台灯来说，网络延迟是致命的。

我们在 OneMira 的研发初期，就确立了一个死磕到底的原则：核心视觉识别和运动规划，必须 100% 在本地运行。

边缘侧模型压缩

这篇日志将分享我们是如何通过模型量化和裁剪，将一个原本需要 4090 才能跑满的视觉-动作模型，塞进低功耗的端侧芯片里的...