智东西kaiyun体育
智东西6月20日报谈,多年来,数据标注在AI产业都处于较边际地带。近期跟着Meta斥资143亿好意思元收购Scale AI 49%股份,该范畴成为东谈主们矜恤的焦点。但此类公司中营收范围最大的一家并非Scale AI,而是由一位80后华东谈主埃德温·陈(Edwin Chen)创立的Surge AI。
Surge AI创立于2020年,定位高端数据标注服务,是谷歌、OpenAI、Anthropic等科技巨头的联接伙伴。 Surge AI的营业模式以高订价和高质料著称,收费是Scale AI的2-5倍;2024年营收已达到10亿好意思元,高于Scale AI的8.7亿好意思元。但Surge AI于今仍未融资,且职工数仅为Surge AI的约1/10。
一、约1/10职工,兑现超Scale AI的营收范围37岁的埃德温·陈莫得投资者,皆备靠我方赤手起家创办了这家于今已建设五年的公司。Surge AI领有110名职工,在纽约和旧金山设有办事处。
▲Surge AI创举东谈主埃德温·陈(Edwin Chen)
据职工最新流露,该公司客岁的营收跳动10亿好意思元,跳动了Scale AI公司同期8.7亿好意思元的营收。该职工称,埃德温·陈暗示Surge AI与Scale AI公司不同,从一开动就盈利。
Surge AI的其他要道财务谋略现在尚不明晰,比如Surge AI在支付其主要由外包工东谈主构成的职工工资后还能剩下若干钱。要是Surge AI能从投资者那处得到与Scale A附近的估值,那么陈将成为一位亿万财主,至少在账面上是这样。
Surge AI主营数据标注业务。其会雇佣多数外包使命主谈主员对AI模子的响应进行评分,并编写数千个编程、数学和法律等范畴的问题和谜底,将其输入到这些AI模子中,本色上是在教养它们什么是好的谜底。Surge AI的子公司Data Annotation Tech在其网站上提到,职工不错“按照我方的时分表老师AI并得到薪金”,起薪为每小时20好意思元。
陈将Surge AI打形成一家高端公司,收取高额用度,平淡是Scale AI的2-5倍。Surge AI以其行业率先的声誉阐扬了订价的合感性。一位Scale AI前职工称,在客户对标签质料的审核中,Surge AI的进展平淡优于Scale AI。而其竞争敌手凯鹏华盈投资的Handshake公司的雇主加勒特·洛德 (Garrett Lord) 也陶然承认,陈是“头号玩家”。
比较于Scale AI超1000多名职工的组织范围,Surge AI在莫得外部老本的情况下天然营业范围超Scale AI,但职工东谈主数仅仅Scale AI的约1/10。
二、对数据行业失望后,80后硅谷华东谈主躬行下场创业埃德温·陈曾在麻省理工学院(MIT)学习话语学和数学,大学毕业后亲眼目击了大公司在数据方面的窘境,于是萌发了创业的念念法。在创办Surge AI之前,陈曾在Facebook、Dropbox、Google和Twitter(现X平台)担任机器学习工程师,设备推选和搜索算法并匡助收罗老师这些算法所需的数据。
尽管这些公司资源丰足,陈照旧遇到了不少艰难。举例,在Facebook,陈解任匡助打造一款Yelp的竞品。他的团队需要老师一个大略正确分类商家的模子,举例分别餐馆和杂货店。为此,他们需要一个包含5万家准确标注商家的数据集,而他发现,要是找一家外部公司来搭建这个数据集,需要六个月的时分。
“除了恭候,咱们别无给与。”述说,“是以咱们只可等。” 数据追想后,陈却发现不对劲。比如系统会把餐馆标注为咖啡店,又把咖啡店标注为病院。“这些数据皆备是垃圾。”述说。
2020年,陈离开Twitter转而创立了Surge AI。为了让Surge AI顺利启动,陈招募了之前使命心仪志的数据标注承包商,并用我方的积累资助了这家初创公司。刚巧的是,陈专注的恰是话语建模,比较之下,Scale AI最初是评估自动驾驶汽车的视觉数据。
不到一年后,OpenAI遴聘了Surge AI来对其模子进行微调,要领是把柄两家公司共同发表的一篇探有计划文,教这些模子如何幸免产生无益复兴,比如带有种族偏见的话语。
到2022年,Anthropic也成为了Surge AI的客户,依靠Surge AI来评估大型话语模子是否大略匡助东谈主类监控其他AI,试图耕种类东谈主AI配景下的安全查验机制。
数据标注还不错确保模子的响应在作风上保抓一致。举例,据一位参与该过程的东谈主士流露,一家企业科技公司曾遴聘Surge AI编写代码过甚附带的解释。
有客户称,Surge AI能如斯快速地生成高质料数据,但其对里面过程深加隐瞒。“我和云提供商联接的时候亦然相似。”这位企业本事客户说,“我不知谈他们的服务为什么这样好用,里面原因是什么。我按下按钮,就很欢叫看到里面使命兑现了这极少。”
数据标注公司平淡会使用多样本事来确保标注员在回答问题时不会盲目跟风。举例,这些公司会飞速插入莫得正确谜底的问题,或者确保多个标注东谈主员对某个问题的正确谜底达成一致。
审核东谈主员也很蹙迫,模子设备东谈主员日益需要更具专科教唆的东谈主,在谋略生物学、表面物理学等前沿范畴撰写问答示例。
陈不肯流露公司如何处理标注员回复的质料,但他称,Surge AI在初步审核过程以外,还会抓续评估其职工;公司不错专揽多种谋略来判断回复是否高质料,举例职工使用的词语或光处所出动阵势。
Meta在投资Surge AI之前曾经将业务交给Scale AI,但Meta也在Surge AI身上干预了大宗资金。据一位知情东谈主士流露,客岁,Meta的生成式AI团队向Surge AI破耗了跳动1.5亿好意思元,用于数据标注使命,Surge AI将谨谨慎新到尾的通盘这个词过程。这位知情东谈主士流露,这与Meta在Scale AI破耗的2亿好意思元驾御进出无几。
三、四大隐忧:职工诉讼、产能富余、客户压价、本事替代天然Surge AI最近照实取得了长足的发展,但它还靠近着好多顽固。
发轫是潜在的法律纠纷问题,比如职工诉讼。曾告状过Surge AI和Scale AI的讼师达纳斯,把现在的情况比作夙昔十年里职工与网约车公司之间抓续多年的法律纠纷。
上个月,Surge AI在加州遭受了一场来自外包职工的集体诉讼 ,被指控之是以收入盛大是因为罪犯计议。诉讼称,该公司将职工归为外包的作念法不对理,应该支付他们培训课程、履历进修等干预的用度,以确保高质料使命。Scale AI和其他数据标签公司也靠近雷同的诉讼。
但陈觉得,好多外包职工,相等是领有博士和硕士学位的东谈主员,经常给与Surge AI而不是其他竞争敌手,因为它不错提供他们念念要的东西:与他们破耗多年时分探讨的范畴关系的接连连续的技俩。
然后是产能富余箝制问题。一些客户响应,Surge AI经常处于满负荷预订情状,连络技俩需要客户快活干预数百万好意思元。与此同期,包括OpenAI在内的模子设备者,正越来越多地通过Mercor等招聘公司,寻找外包东谈主员来完成标注使命。
此外还有价钱下行压力。举例,据一位前谷歌AI本事专揽称,谷歌是Surge AI的长久客户,但为了幸免被锁定,谷歌一直在与更多供应商联接,最终大略以更低的价钱与Surge AI达成来回。
还有本事替代问题。AI设备东谈主员还找到了更低廉的要领来纠正他们的模子,这些要领不需要东谈主工办事,举例蒸馏,即使用更高等模子的谜底来纠正较小模子的过程。
但陈对Surge AI的赓续快速增长并未暗示担忧。“东谈主们往往低估了这个范畴。”他说,“他们觉得东谈主类很智谋,普通的博士也很智谋,是以你不错招募10万东谈主,让他们开脱发展。但咱们发现事实并非如斯。”
结语:Scale AI被并购之际,数据步伐赛谈迎来新机遇跟着Scale AI被Meta投资,OpenAI等好多公司取消与其来回,其他数据标注公司有望迎来新机遇。在老本驱动、范围优先的AI行业中,Surge AI凭借精确的高端定位、零融资高收入的模式,杰出行业领头羊Scale AI的营收范围,有望接住新的机遇。
可是Surge AI靠近的并非坦途,它正面对来自职工诉讼、产能富余、客户议价压力以及AI本事本人演进带来的替代风险等多重挑战。Surge AI能否在保抓其中枢竞争力的同期灵验应付这些挑战,值多礼贴。
源头:The Informationkaiyun体育