294 字
1 分钟
Awesome AI Infra
整理一份自己学 AI Infra 时翻过、觉得有用的 GitHub 资源,按主题分类,不求全。配上这篇博文的 AI Infra Roadmap 来看会更顺。
体系教程
想先建立全局视角,从这两个仓库入手:
- HuaizhengZhang/AI-Infra-from-Zero-to-Hero:系统视角,从零开始覆盖整个领域。
- ai-infra-curriculum:一份课程化的学习路线图。
CUDA 教程
绕不开的底层。先有 CUDA 心智模型,再看上层的训练 / 推理框架会顺很多:
- BBuf/how-to-optim-algorithm-in-cuda:算子优化经典,很多人入门 CUDA 优化都看这个。
- eunomia-bpf/basic-cuda-tutorial:基础入门。
- brucefan1983/CUDA-Programming:相对系统的程序设计教材。
分布式
- ray-project/ray:分布式计算框架的事实标准之一,做 LLM 训练 / 推理调度都绕不开。
精简实现
读源码学不动的时候,找一个把核心抽出来、去掉所有工程细节的 mini 实现,往往比啃完整框架快很多。我个人觉得这一栏的几个仓库最值得花时间:
- GeeeekExplorer/nano-vllm:极简 vLLM。
- keith2018/TinyTorch:微缩 PyTorch。
- kennysong/minigrad:极简自动求导。
- 66RING/tiny-flash-attention:极简 FlashAttention 实现。
- Tongkaio/CUDA_Kernel_Samples:CUDA 算子样例集。
后面继续看到顺手的资源会回来补到这里。