在边缘设备上部署 VLA 视语言动作模型的挑战

彭俊豪
Dev Diary
在边缘设备上部署 VLA 视语言动作模型的挑战

桌面级 AI 的算力悖论

当下的行业共识是“云端大脑”,但对于一台需要实时响应你桌面动作的台灯来说,网络延迟是致命的。

我们在 OneMira 的研发初期,就确立了一个死磕到底的原则:核心视觉识别和运动规划,必须 100% 在本地运行。

边缘侧模型压缩

这篇日志将分享我们是如何通过模型量化和裁剪,将一个原本需要 4090 才能跑满的视觉-动作模型,塞进低功耗的端侧芯片里的...