记录学习心得,分享技术实践
2026-03-07
深入解析主流 Agent 评估框架:AgentBench、SWE-bench、WebShop、ALFWorld、VisualAgentBench。从第一性原理理解 Agent 评估的本质,掌握选型方法论。
从1900年巴舍利耶的随机游走理论到DeepSeek梁文锋的AGI之路,一部关于数学、博弈与人性的探索史
2026-03-06
从算法原理到工程实践,深入解析 verl、slime、AReaL 三大工业界 LLM RL 训练框架