诸丁玮

ayan1988

AI & ML interests

None yet

Recent Activity

upvoted a paper about 8 hours ago

DFPO: Scaling Value Modeling via Distributional Flow towards Robust and Generalizable LLM Post-Training

upvoted a paper 4 months ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

updated a dataset about 2 years ago

ayan1988/diffusion.maobilast

View all activity

Organizations

None yet

upvoted a paper about 8 hours ago

DFPO: Scaling Value Modeling via Distributional Flow towards Robust and Generalizable LLM Post-Training

Paper • 2602.05890 • Published 1 day ago • 1

upvoted a paper 4 months ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Paper • 2510.18927 • Published Oct 21, 2025 • 84

updated 3 datasets about 2 years ago

updated 2 models about 2 years ago

ayan1988/diffusion.maobi

Text-to-Image • Updated Nov 22, 2023

ayan1988/diffusion.7.control_net

0.4B • Updated Nov 22, 2023

updated 2 datasets about 2 years ago

ayan1988/diffusion.maobi

Viewer • Updated Nov 22, 2023 • 319 • 5

ayan1988/diffusion.7.control_net

Viewer • Updated Nov 19, 2023 • 50k • 6

updated a model about 2 years ago

ayan1988/diffusion.8.instruct_pix2pix

Updated Nov 19, 2023

updated 2 datasets about 2 years ago

ayan1988/diffusion.8.instruct_pix2pix

Viewer • Updated Nov 19, 2023 • 1k • 6

ayan1988/diffusion.9.custom_diffusion

Viewer • Updated Nov 19, 2023 • 200 • 6

updated a model over 2 years ago

ayan1988/diffusion.interaction

Text-to-Image • Updated Oct 6, 2023

updated a dataset over 2 years ago

ayan1988/diffusion.interaction

Viewer • Updated Oct 6, 2023 • 105 • 7