Posts

2026

06月

  • From CLIP to VLA 06-09 (modified: 06-09)

    我自己的学习过程 从CLIP讲到VLA

  • 手写一个 Autograd 引擎 06-08 (modified: 06-08)

    从零实现 micrograd 风格的 autograd,建立对反向传播机制的直观理解

  • Torch 06-04 (modified: 06-10)

    一些常见的pytorch的用法

  • policy algorithm 06-03 (modified: 06-10)

    PPO损失函数的推导与理解

  • Transformer 06-01 (modified: 06-10)

    基于 nanogpt 的 transformer 复习

05月

  • Data_structure 05-22 (modified: 06-10)

    一些做题时候容易忘记/重要的trick

  • TD & PG 05-21 (modified: 05-29)

    关于TD,PG的一些推导

  • RL Basis 05-21 (modified: 05-21)

    关于强化学习的一些基础概念