UOCC 毕设知识网络
时间线
对比
模块
EN
中文
日本語
系统概览
u01
系统概览
算法模块
u02
OOK 调制解调
u03
RLL 编码
u04
自适应控制
u05
阻尼多状态机
u06
MIMO 合并
系统架构
u07
发射端设计
u08
接收端设计
u09
CUDA 加速
实验记录
u10
实验记录
进度追踪
u11
进度追踪
设计演进
u12
设计演进
u09
CUDA 加速
系统架构
GPU 并行化解调
OOK解调+RLL解码CUDA核
>10x加速比
学习
模拟
代码
深入
GPU Parallelized Demodulation on Jetson Orin NX
架构
←
上一章
u08 - 接收端设计
下一章
实验记录 - u10
→
CUDA 加速
Jetson Orin NX — GPU Kernel Visualization
待接收帧...
CPU Memory Buffer
Pipeline Stage
CPU → GPU DMA
OOK Kernel
并行阈值判决
RLL Kernel
输出比特流
性能目标
GPU 延迟
< 10ms
帧率
≥ 30 fps
加速比
> 10×
CUDA 并行加速
Jetson Orin NX 上的 GPU 并行解调架构。
1/10