its-gen1/design/ARCHITECTURE.md

103 lines
3.9 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 智能挂车AI-Box软件架构设计
## 1. 系统概述
基于深明奥思Fellow 1芯片(138 TOPS)的异构三核架构(MCU+SoC+F1)实现商用车AI-Box Demo。系统采用双核心管理架构MCU负责电源管理和硬件监控SoC负责系统调度和应用逻辑F1负责大模型和CNN推理加速。
## 2. 系统分层架构
### 2.1 驱动层 (MCU + SoC)
- **MCU子系统**:
- 电源管理状态机4种模式
- SPI/UART/GPIO通信驱动严格遵循IPCL协议
- SoC健康状态监控1秒周期3秒超时复位
- 硬件故障检测与处理
- **SoC子系统**:
- Linux内核驱动GPIO/I2C/SPI/UART/PCIe/V4L2
- Fellow 1 NPU驱动PCIe 3.0接口)
- 摄像头V4L2框架驱动
- 温度监控与保护
### 2.2 框架层 (SoC + F1)
- **通信中间件**:
- MCU-SoC: SPI(≥10Mbps) + UART(≥1Mbps) + GPIO(RESET_N)
- SoC-F1: PCIe 3.0 (8 GT/s)
- IPCL协议栈实现含CRC校验、重传机制、大文件分片
- **推理引擎**:
- ONNX Runtime + Fellow 1专用NPU加速器
- INT4/INT8量化支持
- 模型分片加载与内存管理
- **系统服务**:
- 电源模式管理(运行/休眠/低功耗/关机)
- 唤醒源管理(钥匙/远程/传感器/定时)
- 故障恢复机制(强制复位、安全模式)
### 2.3 应用层 (SoC)
- **AI服务**:
- 大模型推理APIQwen-7B/LLaMA-7B
- CNN物体识别服务
- 多模态交互接口
- **系统服务**:
- 电源状态机协调
- 温度适应性控制
- 远程管理接口
- **多模态接口**:
- OpenAI API兼容层
- WebSocket实时通信
- RESTful管理API
## 3. 大模型推理引擎集成方案
### 3.1 模型格式与优化
- 统一使用ONNX格式支持Qwen-7B/LLaMA-7B转换
- INT4/INT8量化优化适配F1芯片NPU特性
- 模型剪枝和蒸馏满足50g重量限制下的内存约束
### 3.2 部署策略
- 模型分片加载避免内存溢出支持512字节SPI包长限制
- 共享内存池管理减少CPU-GPU数据拷贝
- 异步推理队列,支持多任务并发
- 温度自适应推理频率调整(-40℃~85℃环境适应
## 4. 电源管理模块设计
### 4.1 四种工作模式基于IPCL规范
- **运行模式**: 全功能开启,高性能推理 (~10W, 0ms唤醒)
- **休眠模式**: SoC降频必要传感器工作 (~2W, 100ms唤醒)
- **低功耗模式**: SoC深度睡眠仅关键唤醒源 (~0.5W, 500ms唤醒)
- **关机模式**: SoC完全关闭仅MCU超低功耗 (~0.1W, 2000ms唤醒)
### 4.2 状态机与协议实现
- MCU主导电源状态切换SoC通过SPI发送POWER_MODE_REQ
- 严格遵循IPCL电源模式切换流程6步握手协议
- 唤醒源优先级管理:钥匙启动 > 远程唤醒 > 传感器触发 > 定时唤醒
- 故障处理SoC异常时MCU通过GPIO RESET_N强制复位≥100ms低电平
## 5. 摄像头数据处理流水线
### 5.1 数据通路(零拷贝优化)
```
摄像头 → V4L2驱动 → 图像预处理 → DMA传输 → F1共享内存 → CNN推理 → 结果回调
```
### 5.2 性能与可靠性
- 零拷贝DMA传输避免CPU内存瓶颈
- 多缓冲区流水线处理,支持实时视频流
- 端到端延迟 < 100ms满足商用车实时性要求
- 极端温度环境下的稳定性保障-40℃~85℃)
## 6. 关键技术指标
- **硬件平台**: Fellow 1芯片138 TOPS算力
- **工作温度**: -40 ~ 85
- **尺寸重量**: 60mm × 60mm, 50g
- **推理性能**: Qwen-7B @ 138 TOPS, LLaMA-7B @ 138 TOPS
- **通信性能**: SPI 10Mbps, UART 1Mbps, PCIe 3.0 8GT/s
- **电源管理**: 四级电源模式智能功耗控制
- **可靠性**: 3秒SoC健康监测强制复位保护
## 7. 后续工作计划
- [ ] 详细IPCL协议栈实现SPI/UART/GPIO驱动
- [ ] 电源管理状态机开发与测试
- [ ] Fellow 1 NPU驱动集成与优化
- [ ] 大模型量化与部署验证
- [ ] 端到端系统集成与环境测试
- [ ] 故障恢复机制验证