Posts
2026
06月
- From CLIP to VLA 06-09 (modified: 06-09)
我自己的学习过程 从CLIP讲到VLA
- 手写一个 Autograd 引擎 06-08 (modified: 06-08)
从零实现 micrograd 风格的 autograd,建立对反向传播机制的直观理解
- Torch 06-04 (modified: 06-10)
一些常见的pytorch的用法
- policy algorithm 06-03 (modified: 06-10)
PPO损失函数的推导与理解
- Transformer 06-01 (modified: 06-10)
基于 nanogpt 的 transformer 复习
05月
- Data_structure 05-22 (modified: 06-10)
一些做题时候容易忘记/重要的trick
- TD & PG 05-21 (modified: 05-29)
关于TD,PG的一些推导
- RL Basis 05-21 (modified: 05-21)
关于强化学习的一些基础概念