70 lines
2.2 KiB
Markdown
70 lines
2.2 KiB
Markdown
# 智能挂车AI-Box软件架构设计
|
||
|
||
## 1. 系统概述
|
||
基于深明奥思Fellow 1芯片(138 TOPS)的异构多核架构(MCU+SoC+F1),实现商用车AI-Box Demo。
|
||
|
||
## 2. 系统分层架构
|
||
|
||
### 2.1 驱动层 (MCU + SoC)
|
||
- **MCU子系统**: 电源管理、硬件监控、低功耗控制
|
||
- **SoC子系统**: Linux内核驱动、V4L2摄像头框架、PCIe/SPI/UART通信驱动
|
||
|
||
### 2.2 框架层 (SoC + F1)
|
||
- **通信中间件**: MCU-SoC(SPI/UART) + SoC-F1(PCIe 3.0)
|
||
- **推理引擎**: ONNX Runtime + Fellow 1专用加速器
|
||
- **模型管理**: 动态加载/卸载、内存优化、量化支持
|
||
|
||
### 2.3 应用层 (SoC)
|
||
- **AI服务**: 大模型推理API、CNN物体识别服务
|
||
- **系统服务**: 电源状态机、温度监控、故障恢复
|
||
- **多模态接口**: OpenAI API兼容层、WebSocket实时通信
|
||
|
||
## 3. 大模型推理引擎集成方案
|
||
|
||
### 3.1 模型格式
|
||
- 统一使用ONNX格式,支持Qwen-7B/LLaMA-7B转换
|
||
- INT4/INT8量化优化,适配F1芯片NPU特性
|
||
|
||
### 3.2 部署策略
|
||
- 模型分片加载,避免内存溢出
|
||
- 共享内存池管理,减少数据拷贝
|
||
- 异步推理队列,支持多任务并发
|
||
|
||
## 4. 电源管理模块设计
|
||
|
||
### 4.1 四种工作模式
|
||
- **运行模式**: 全功能开启,高性能推理
|
||
- **待机模式**: SoC休眠,MCU监听唤醒事件
|
||
- **低功耗模式**: 仅MCU运行,维持基本监控
|
||
- **关机模式**: 完全断电,支持远程唤醒
|
||
|
||
### 4.2 状态机设计
|
||
- MCU主导电源状态切换
|
||
- SoC通过SPI发送电源请求
|
||
- 温度异常自动降频保护
|
||
|
||
## 5. 摄像头数据处理流水线
|
||
|
||
### 5.1 数据通路
|
||
```
|
||
摄像头 → V4L2驱动 → 图像预处理 → DMA传输 → F1共享内存 → CNN推理 → 结果回调
|
||
```
|
||
|
||
### 5.2 性能优化
|
||
- 零拷贝DMA传输
|
||
- 多缓冲区流水线处理
|
||
- 实时性保障:端到端延迟 < 100ms
|
||
|
||
## 6. 关键技术指标
|
||
- **工作温度**: -40℃ ~ 85℃
|
||
- **尺寸重量**: 60mm × 60mm, 50g
|
||
- **推理性能**: Qwen-7B @ 138 TOPS
|
||
- **功耗控制**: 四级电源管理模式
|
||
- **通信带宽**: PCIe 3.0 (8 GT/s)
|
||
|
||
## 7. 后续工作计划
|
||
- [ ] 详细接口规范定义
|
||
- [ ] 驱动开发和调试
|
||
- [ ] 推理引擎集成测试
|
||
- [ ] 电源管理状态机实现
|
||
- [ ] 端到端系统联调 |