Runze Liu's picture

5 21 4

Runze Liu

RyanLiu112

·

https://ryanliu112.github.io

AI & ML interests

LLM, RL

Recent Activity

upvoted a paper about 20 hours ago

GARDO: Reinforcing Diffusion Models without Reward Hacking

upvoted an article 10 days ago

Deriving the PPO Loss from First Principles

upvoted a paper 13 days ago

Step-DeepResearch Technical Report

View all activity

Organizations

upvoted a paper about 20 hours ago

GARDO: Reinforcing Diffusion Models without Reward Hacking

Paper • 2512.24138 • Published 8 days ago • 25

upvoted an article 10 days ago

Article

Deriving the PPO Loss from First Principles

13 days ago

•

32

upvoted a paper 13 days ago

Step-DeepResearch Technical Report

Paper • 2512.20491 • Published 15 days ago • 80

upvoted a collection 14 days ago

Physics of Language Models: Part 4.2

17 items • Updated 16 days ago • 2

upvoted a paper 14 days ago

Bottom-up Policy Optimization: Your Language Model Policy Secretly Contains Internal Policies

Paper • 2512.19673 • Published 16 days ago • 60

upvoted a collection 14 days ago

"Physics of Language Models" series

7 items • Updated 16 days ago • 52

upvoted a paper 14 days ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Paper • 2512.07783 • Published 30 days ago • 36

updated a model about 1 month ago

RyanLiu112/1.5a_first2

2B • Updated about 1 month ago • 4

published a model about 1 month ago

RyanLiu112/1.5a_first2

2B • Updated about 1 month ago • 4

updated a model about 1 month ago

RyanLiu112/1.5a_woabf_480

2B • Updated about 1 month ago • 3

published a model about 1 month ago

RyanLiu112/1.5a_woabf_480

2B • Updated about 1 month ago • 3

updated a model about 1 month ago

RyanLiu112/1.5a_wodiff_420

2B • Updated about 1 month ago • 3

published a model about 1 month ago

RyanLiu112/1.5a_wodiff_420

2B • Updated about 1 month ago • 3

updated a model about 1 month ago

RyanLiu112/1.5a_atb_740

2B • Updated about 1 month ago • 3

published a model about 1 month ago

RyanLiu112/1.5a_atb_740

2B • Updated about 1 month ago • 3

updated a model about 1 month ago

RyanLiu112/1.5t_700

2B • Updated Dec 7, 2025 • 2

published a model about 1 month ago

RyanLiu112/1.5t_700

2B • Updated Dec 7, 2025 • 2

updated a model about 1 month ago

RyanLiu112/1.5g_740

2B • Updated Dec 7, 2025 • 2

published a model about 1 month ago

RyanLiu112/1.5g_740

2B • Updated Dec 7, 2025 • 2

updated a dataset 3 months ago

RyanLiu112/a_data

Viewer • Updated Oct 24, 2025 • 184k • 63