Chiwei Zhu's picture

8 11 1

Chiwei Zhu

IgnoraZ

·

Ignoramus0817

AI & ML interests

None yet

Recent Activity

authored a paper about 13 hours ago

DeepResearch Bench II: Diagnosing Deep Research Agents via Rubrics from Expert Report

authored a paper about 13 hours ago

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

authored a paper about 13 hours ago

Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles

View all activity

Organizations

authored 4 papers about 13 hours ago

DeepResearch Bench II: Diagnosing Deep Research Agents via Rubrics from Expert Report

Paper • 2601.08536 • Published 21 days ago • 3

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published 2 days ago • 38

Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles

Paper • 2602.01590 • Published 2 days ago • 30

WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora

Paper • 2602.02053 • Published 1 day ago • 39

submitted a paper to Daily Papers about 19 hours ago

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published 2 days ago • 38

authored a paper 5 months ago

MCP-AgentBench: Evaluating Real-World Language Agent Performance with MCP-Mediated Tools

Paper • 2509.09734 • Published Sep 10, 2025 • 16

authored 3 papers 8 months ago

DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents

Paper • 2506.11763 • Published Jun 13, 2025 • 74

Rationales Are Not Silver Bullets: Measuring the Impact of Rationales on Model Performance and Reliability

Paper • 2505.24147 • Published May 30, 2025

From Real to Synthetic: Synthesizing Millions of Diversified and Complicated User Instructions with Attributed Grounding

Paper • 2506.03968 • Published Jun 4, 2025 • 15