
为大模子开启"下半场"的姚顺雨,也开启了个东谈主 AI 的下半场。
就在最近,这位明星 OpenAI 华东谈主征询员的动态,运转被火热怜惜。
之前有东谈主说他出咫尺小扎的必挖名单上,也有东谈主最近爆料他行将加盟其他的巨头——何况是中国科技巨头,"转会费"也有了惊东谈主传说。以及还有一种说法,姚顺雨取舍个东谈主创业……
姚顺雨去哪儿?还不知谈。
但姚顺雨下野 OpenAI,得到了不同渠谈的阐明,只差个东谈主官宣。
他似乎就此要开启个东谈主 AI 的下半场了。
这个刚刚 29 岁的年青东谈主,合肥一中毕业、NOI 奥赛银牌、高考 704 分以安徽探花插足清华姚班,临了在普林斯顿获取贪图机博士(话语和强化学习观念),毕业就加入了 OpenAI ……
何况更早之前,姚顺雨就有着杰出而著名的科研终结,比如:
想维树(Tree of Thoughts):让 LLM 反复想考,大幅提升推明智商
SWE-bench:一个大模子智商评估数据集。
SWE-agent:一个开源 AI 要津员。
ReAct …
以至还有杰出年级的哲想,一篇" AI 下半场"的博文,在 AI 圈表里洛阳纸贵。
是以姚顺雨,究竟是一个怎么的年青东谈主?
姚顺雨成长之路
在 2024 年刚加入 OpenAI 不久,姚顺雨在一次采访中保举了一册书——《哥德尔、艾舍尔、巴赫:集异璧之大成》。

这部由东谈主工智能前驱侯世达撰写的经典文章,将哥德尔的不完备定理、艾舍尔的错觉画图和巴赫的复调卡农微妙融汇,展现了这些看似无关的元素如安在贪图机的通用递归系统中彼此呼应,并留住了一句书不宣意的话:觅之,便有所获。
正如这本书所启发的那样,跨学科的眼神与对复杂信息的灵通立场,似乎聚拢戴姚顺雨的通盘肄业生计,并逐渐酿成一种个东谈主的格调特色。
和通盘的学霸一样,姚顺雨初中就读于合肥最佳的学校之一——合肥 45 中(2009 — 2012),初中毕业后升入合肥市第一中学。
2014 年,他在寰宇信息学奥林匹克竞赛(NOI)中以 495 分斩获银牌;次年高考以理科704 分的收获位列安徽省第三,插足清华交叉信息征询院姚班,主修贪图机科学。
而这看似"圭表学霸"的开局背后,其实滋长着一颗不太一样,以至稍有反叛的气质。

△来自清小华
姚顺雨在采访中清晰,相较其他清华姚班的同学专注于少量,抑制深挖的品性,他更爱看很渊博学,历史,乃至种各样前俯后合的东西。
而他对嘻哈音乐的心疼,也早已不是什么新闻。
艾米纳姆、蛋堡、热狗、Jcole 等说唱歌手随同着他的初高中,而在清华他照旧清华大学学生说唱社搭伙首创东谈主。
值得一提的是,在清华大学 2019 年各样型自主遴荐复试的开营典礼上,姚顺雨就给当年的学弟学妹们甩出了一句号称" freestyle "的原理,证明我方为什么选清华:
但是关于我来说,取舍清华、北大并不是问题,因为北大莫得我姓氏定名的班级。

除了担任说唱社搭伙首创东谈主外,姚顺雨还担任清华的招生志愿者和姚班联席会主席。在谈及姚班对他的影响时,他提到:
姚班很崇尚表面基础课程的学习,像操作系统或电路想象筹画的课,看上去和科研大致莫得任何筹画,但是咫尺看来照旧有些匡助的。它能使你对贪图机科学的全貌有基本了解。

△(姚班合影,清华招生公众号)
这种兼容各样信息、涉猎不同学科并从中寻找乐趣的跨界气质,在姚顺雨身上推崇得尤为彰着。用以赛亚 · 伯林的话来说,他更像是一只"狐狸",而不是一只"刺猬",而这也体咫尺他后续的征询中。
(注:柏林的"刺猬"比方那些专注于单一核神志念的东谈主,他们把通盘教训王人套用到这个中心不雅点上;而"狐狸"则指那些涉猎是非、善于纯真应答不同问题的东谈主,更依赖各样化的战术和视角)
让东谈主颇感诧异的是,在大三放学期之前,姚顺雨既莫得战争过 AI,以至连科研也莫得作念过。
一次交换的契机让他去了 MIT,在此之后,他才运转随着吴佳俊作念一些贪图机、视觉以及明白科学的征询。
姚顺雨暗示,在随从吴佳俊和学长 Jun-Yan Zhu 学习时,他不仅掌捏了实验、呈报等征询初学的基本功,更受到想想上的深远影响,他由此相识到神志学与东谈主工智能的交叉,学会了从更高维度和全体框架去想考问题。
终结姚班四年的学习后,2019 年,他精良赶赴普林斯顿攻读博士,跨界气质再次显现。
本科阶段他主要征询贪图机视觉,而博士阶段,蓝本被贪图机视觉观念及第的他,却因为兴味转向,自行筹画了天然话语处理(NLP)界限的导师。最终,他因机缘恰巧加入了Karthik Narasimhan的团队,运转从事天然话语处理与强化学习的征询。
这等于是从视觉转到了话语,但"觅之,便有所获"。姚顺雨在过后回料到,这种跨界亦然他的行运之处,因为彼时正逢 GPT-2 兴起。因此,在博士的第一年,他就如故运转想着如何让 language model 变成 Agent.
而对(通用)Agent 的怜惜聚拢戴他的征询。

姚顺雨博士生计的第一个使命叫 CALM(2020),征询如何用话语模子来看成 Agent 来玩话语游戏。

在 CALM 中,话语就像序言:它把东谈主类教训和语义形式回荡为可操作的动作候选,同期承载凹凸文信息,使智能体在高大的动作空间中高效方案。
姚顺雨暗示,天然这篇使命并不像 swebench、ReAct 或想维树那么盛名,但对他来说具有蹙迫酷爱酷爱。
在张小珺的对谈中,咱们发现姚顺雨对话语的怜惜早在这篇 5 年前的论文中就已萌芽。
话语是东谈主为了完结泛化而发明出来的器具,这少量比其他东西更实质。
换句话说,用话语来玩游戏是无尽的,Agent 不错凭借话语进行推理和组合,在不同的凹凸文中找到符合的动作,泛化就由此而来。
换句话说,Agent 也需要具备"跨界"智商,而话语则是绝佳的序言。
然则,姚顺雨也封锁到,要是莫得一个好的任务或环境,即使把"游戏"玩得再高分,也毫无酷爱酷爱。
基于这一想考,他的第二篇使命WebShop构建了一个大限度模拟电商环境,使智能体通过谐和复漫笔本辅导,在网页中进行导航和操作,从而鞭策话语谐和与方案智商在真实世界任务中的诓骗与考据。

不异的,其后的经典使命SWE-Bench和SWE-agent亦然针对一个特酷爱酷爱的任务(试验编程)伸开对 Agent 智商的考据。
而当期间到了 2022 年,GPT-3.5的出现调动了一切。
人所共知,让一张白纸反复试错的效能极低,而在传统强化学习中,这种低效尝试却层出不穷:智能体每每要么被铁心只作念单一任务,比如下围棋,要么在高大的动作空间中盲目探索。
GPT-3.5 让东谈主们封锁到,之前缺失的是先验知识:通过强劲的话语预考核,将学问和话语知识融入模子,再通过微调,它才智成为具备跨界气质、领有泛化智商的 Agent。
正如姚顺雨所说:要是你的 Pre-Training(预考核)如故包含了通盘事情,那么 RL(强化学习)只是引发出这些智商的 skill(手段)。
在受到 GPT-3.5 的启发后,姚顺雨就作念了 ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),让废话语模子在与外部环境交互时,同期进行"推理"和"行为"。

姚顺雨其后评价到这是他最可爱的使命(亦然他咫尺被引次数最高的使命)。基于此,他的征询逐渐转向于两个中枢,一是怎么去作念一些有价值、和试验世界更筹画的任务和环境;二是怎么去作念一些肤浅、但又通用的法子。
不外,为了完结通用,泛化,必须学会推理。而话语模子刚好提供了一个满盈强的先验(prior),这个先验让你不错推理,而推理又能在不同的环境间泛化。
于是,在 GPT、想维链等使命的基础上,想维树(Tree of Thoughts, ToT)让话语模子通过多旅途探索和自我评估,从而完结比传统左到右推理更高效的复杂问题惩办智商。

纪念姚顺雨的肄业与征询,不难发现,不管是他对通用智能体的追求,照旧对话语看成明白与方案序言的热忱,王人是对跨界想维与泛化智商的持续探索。

28 岁的九局下半
比拟于热狗的 23 岁,28 岁博士毕业插足 OpenAI 的姚顺雨,才竟然迎来我方的的"九局下半"。
2024 年 8 月 1 日,姚顺雨文告加入 OpenAI,一期间,说是万众慎重也绝不为过。

PS:在说到姚顺雨与 OpenAI 的渊源时,一个不太冷的冷知识是姚顺雨的导师 Karthik Narasimhan 是 GPT ‑ 1 第二作家。

在加入 OpenAI 的一年多期间,姚顺雨最出圈的莫过于本年 4 月发表的博文《The Second Half》,宣告 AI 干线程的游戏已插阁下半场。
(是的,AI 也迎来了我方的九局下半)
姚顺雨暗示:AI 发展分为凹凸两阶段。上半场以模子和法子为中心,中枢构建了模子和考核法子;随着 AI 技巧教训,下半场的重心转向如何界说有试验酷爱酷爱的任务、如何有用评估 AI 系统的推崇。
新的评估应该迫临试验世界任务、优化模子配方惩办任务,酿成新的正向轮回。
在这,咱们不出丑出姚顺雨姿态的转机:从专注求解的科研使命者,逐渐成长为善于发现需求的"产物司理"。
据刚刚曝光的一次与张小珺的访谈中,姚顺雨也谈到了创业的底层逻辑:
毕业前我想得多的是,怎么创造一个爱因斯坦?我当时是比较 academia(学院派)的东谈主——你在普林斯顿,你的偶像是冯诺依曼、爱因斯坦——很天然,能料到最特酷爱的任务是,我能不行发现下一个相对论?这毫无疑问能记号,AGI 或 ASI(超东谈主工智能)完结了。其后,我到了硅谷,到了加州,插足公司之后,我发现东谈主类的组织亦然一个特酷爱的事情。要是能创造一家新的公司,创造一个 one trillion dollar(一万亿好意思元)、基于 Agent 的公司,是很特酷爱的。
而当谈到是否会出去创业时,姚顺雨更是坦率地暗示:OpenAI 大渊博东谈主王人会计议创业。他需要去作念更有挑战的事情,去创业是很天然的。天然,照旧应该找到一个好的事情。他可爱把事情想得明晰少量再去作念。
天然,从 OpenAI 下野也不一定非得创业,比如姚顺雨的导师 Karthik Narasimhan,就在 OpenAI 呆了一年后,取舍了离开,并去普林斯顿延续象牙塔科研了。
如今,姚顺雨加入 OpenAI 也过了整整一个年初。
有爆料说"姚顺雨上亿薪资入职腾讯",但被腾讯官方对外辟谣否定了。

还有一家全新的创业公司刚刚被注册,法东谈主代表恰是"姚顺雨"——

但咫尺依然难以确定这个"姚顺雨"是不是等于咱们研究的姚顺雨,毕竟叫"尧舜禹"这种好名字的,只是 AI 界限,不啻一位…
总之,祝愿姚顺雨开启下半场。
参考邻接
[ 1 ] https://openreview.net/profile?id=~Shunyu_Yao1&utm_source=chatgpt.com
[ 2 ] https://ysymyth.github.io/?utm_source=chatgpt.com
[ 3 ] https://x.com/shunyuyao12?lang=en&utm_source=chatgpt.com
一键三连「点赞」「转发」「留意心」
接待在批驳区留住你的想法!
— 完 —
� � 年度科技风向标「2025 东谈主工智能年度榜单」评比报名开启啦!咱们正在寻找 AI+ 时间领航者 点击了解细则
❤️� � 企业、产物、东谈主物 3 大维度,共建造了 5 类奖项,接待企业报名参与 � �

一键怜惜 � � 点亮星标
科技前沿进展逐日见kaiyun体育