R.Xing Blog

From CLIP to VLA

2026-06-09 dl clip multimodal vla

我自己的学习过程从CLIP讲到VLA

手写一个 Autograd 引擎

2026-06-08 dl pytorch 反向传播

从零实现 micrograd 风格的 autograd，建立对反向传播机制的直观理解

Torch

2026-06-04 pytorch tutorial

一些常见的pytorch的用法

policy algorithm

2026-06-03 ppo RL

PPO损失函数的推导与理解

Transformer

2026-06-01 dl transformer

基于 nanogpt 的 transformer 复习

Data_structure

2026-05-22 algoritm cpp python

一些做题时候容易忘记/重要的trick

TD & PG

2026-05-21 强化学习

关于TD,PG的一些推导

RL Basis

2026-05-21 强化学习

关于强化学习的一些基础概念