9 7

Gao Shiyu

chenyuti

AI & ML interests

None yet

Recent Activity

upvoted a paper about 7 hours ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

liked a model 3 days ago

sentence-transformers/all-mpnet-base-v2

upvoted a paper 3 days ago

Adam's Law: Textual Frequency Law on Large Language Models

View all activity

Organizations

None yet

upvoted a paper about 7 hours ago

Rethinking Generalization in Reasoning SFT: A Conditional Analysis on Optimization, Data, and Model Capability

Paper • 2604.06628 • Published 4 days ago • 189

liked a model 3 days ago

sentence-transformers/all-mpnet-base-v2

upvoted a paper 3 days ago

Adam's Law: Textual Frequency Law on Large Language Models

Paper • 2604.02176 • Published 10 days ago • 295

upvoted a paper 4 days ago

LinguDistill: Recovering Linguistic Ability in Vision- Language Models via Selective Cross-Modal Distillation

Paper • 2604.00829 • Published 11 days ago • 8

liked a dataset 7 days ago

mlfoundations/MINT-1T-PDF-CC-2024-18

Updated Sep 19, 2024 • 1.03M • 25

liked a dataset 8 days ago

Raluca13/Amp-Phase-2D-Histogram-Dataset

Updated 8 days ago • 60 • 1

liked a dataset 11 days ago

allenai/dolma3_mix-6T-1025-7B

Updated Jan 15 • 542k • 43

upvoted 2 papers 11 days ago

Make Geometry Matter for Spatial Reasoning

Paper • 2603.26639 • Published 15 days ago • 32

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization

Paper • 2603.19835 • Published 23 days ago • 330

upvoted a paper 24 days ago

InCoder-32B: Code Foundation Model for Industrial Scenarios

Paper • 2603.16790 • Published 25 days ago • 307

upvoted a paper 28 days ago

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Paper • 2603.04597 • Published Mar 4 • 210

liked 2 models about 1 month ago

Nanbeige/Nanbeige4.1-3B

Text Generation • 4B • Updated 18 days ago • 402k • • 1.03k

MiniMaxAI/MiniMax-M2.5

Text Generation • 229B • Updated Mar 10 • 718k • • 1.37k

upvoted 2 papers about 2 months ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published Feb 9 • 263

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

liked a model about 2 months ago

LocoreMind/LocoOperator-4B

Text Generation • 4B • Updated Feb 24 • 1.16k • 209

Gao Shiyu

AI & ML interests

Recent Activity

Organizations

chenyuti's activity