its-gen1/docs/architecture/ARCHITECTURE.md

103 lines
3.9 KiB
Markdown
Raw Permalink Normal View History

# 智能挂车AI-Box软件架构设计
## 1. 系统概述
基于深明奥思Fellow 1芯片(138 TOPS)的异构三核架构(MCU+SoC+F1)实现商用车AI-Box Demo。系统采用双核心管理架构MCU负责电源管理和硬件监控SoC负责系统调度和应用逻辑F1负责大模型和CNN推理加速。
## 2. 系统分层架构
### 2.1 驱动层 (MCU + SoC)
- **MCU子系统**:
- 电源管理状态机4种模式
- SPI/UART/GPIO通信驱动严格遵循IPCL协议
- SoC健康状态监控1秒周期3秒超时复位
- 硬件故障检测与处理
- **SoC子系统**:
- Linux内核驱动GPIO/I2C/SPI/UART/PCIe/V4L2
- Fellow 1 NPU驱动PCIe 3.0接口)
- 摄像头V4L2框架驱动
- 温度监控与保护
### 2.2 框架层 (SoC + F1)
- **通信中间件**:
- MCU-SoC: SPI(≥10Mbps) + UART(≥1Mbps) + GPIO(RESET_N)
- SoC-F1: PCIe 3.0 (8 GT/s)
- IPCL协议栈实现含CRC校验、重传机制、大文件分片
- **推理引擎**:
- ONNX Runtime + Fellow 1专用NPU加速器
- INT4/INT8量化支持
- 模型分片加载与内存管理
- **系统服务**:
- 电源模式管理(运行/休眠/低功耗/关机)
- 唤醒源管理(钥匙/远程/传感器/定时)
- 故障恢复机制(强制复位、安全模式)
### 2.3 应用层 (SoC)
- **AI服务**:
- 大模型推理APIQwen-7B/LLaMA-7B
- CNN物体识别服务
- 多模态交互接口
- **系统服务**:
- 电源状态机协调
- 温度适应性控制
- 远程管理接口
- **多模态接口**:
- OpenAI API兼容层
- WebSocket实时通信
- RESTful管理API
## 3. 大模型推理引擎集成方案
### 3.1 模型格式与优化
- 统一使用ONNX格式支持Qwen-7B/LLaMA-7B转换
- INT4/INT8量化优化适配F1芯片NPU特性
- 模型剪枝和蒸馏满足50g重量限制下的内存约束
### 3.2 部署策略
- 模型分片加载避免内存溢出支持512字节SPI包长限制
- 共享内存池管理减少CPU-GPU数据拷贝
- 异步推理队列,支持多任务并发
- 温度自适应推理频率调整(-40℃~85℃环境适应
## 4. 电源管理模块设计
### 4.1 四种工作模式基于IPCL规范
- **运行模式**: 全功能开启,高性能推理 (~10W, 0ms唤醒)
- **休眠模式**: SoC降频必要传感器工作 (~2W, 100ms唤醒)
- **低功耗模式**: SoC深度睡眠仅关键唤醒源 (~0.5W, 500ms唤醒)
- **关机模式**: SoC完全关闭仅MCU超低功耗 (~0.1W, 2000ms唤醒)
### 4.2 状态机与协议实现
- MCU主导电源状态切换SoC通过SPI发送POWER_MODE_REQ
- 严格遵循IPCL电源模式切换流程6步握手协议
- 唤醒源优先级管理:钥匙启动 > 远程唤醒 > 传感器触发 > 定时唤醒
- 故障处理SoC异常时MCU通过GPIO RESET_N强制复位≥100ms低电平
## 5. 摄像头数据处理流水线
### 5.1 数据通路(零拷贝优化)
```
摄像头 → V4L2驱动 → 图像预处理 → DMA传输 → F1共享内存 → CNN推理 → 结果回调
```
### 5.2 性能与可靠性
- 零拷贝DMA传输避免CPU内存瓶颈
- 多缓冲区流水线处理,支持实时视频流
- 端到端延迟 < 100ms满足商用车实时性要求
- 极端温度环境下的稳定性保障(-40℃~85℃
## 6. 关键技术指标
- **硬件平台**: Fellow 1芯片138 TOPS算力
- **工作温度**: -40℃ ~ 85℃
- **尺寸重量**: 60mm × 60mm, 50g
- **推理性能**: Qwen-7B @ 138 TOPS, LLaMA-7B @ 138 TOPS
- **通信性能**: SPI ≥10Mbps, UART ≥1Mbps, PCIe 3.0 8GT/s
- **电源管理**: 四级电源模式,智能功耗控制
- **可靠性**: 3秒SoC健康监测强制复位保护
## 7. 后续工作计划
- [ ] 详细IPCL协议栈实现SPI/UART/GPIO驱动
- [ ] 电源管理状态机开发与测试
- [ ] Fellow 1 NPU驱动集成与优化
- [ ] 大模型量化与部署验证
- [ ] 端到端系统集成与环境测试
- [ ] 故障恢复机制验证