LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

【新智元导读】meta内部上演了最戏剧性的一幕,算力短缺纷争不断,LLaMA核心作者超半数已经离职。甚至,连大模型开发团队进行了三轮重组,meta全力赶超谷歌微软的路还有多远?

过去6个月,ChatGPT的爆火,彻底让meta坐不住了。

从2月开始开源大模型系列LLaMA的发布,到Llama2升级、再到编码模型Code Llama,meta可谓是赌上所有去ALL IN AI。

在开源社区,Llama系列模型的免费研究和商用,直接点燃了平替模型裂变的火种。

可是,meta在风光的同时,AI团队正面临着离职潮。

The Information独家报道,因内部算力之争,LLaMA和OPT项目的团队成员,大半已经辞职。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

甚至,meta直接弃掉他们正研发能与PaLM匹敌的模型,将meta AI的两个实验室团队重组,以专注研发Llama2。

meta大部分研究人员的离职,恰恰暴露了,算力短缺是布局生成式AI的核心难题。

LLaMA论文14位作者,一半离职

在外界看来,科技巨头拥有比大多数公司更多的计算资源。一些公司包括meta在内,在招聘AI研究人员时,一致强调自己是「GPU RICH」。

但事实上,自己心知肚明,meta的计算资源供应方面也存在限制。

由此,算力纷争便在内部团队开启,让许多人弃meta而去。

具体来讲,今年2月发布的初代LLaMA模型中的14位作者,已经超过一半的人全部离职。

有的转向AI初创公司,有的加入了科技巨头。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

论文地址:https://arxiv.org/pdf/2302.13971.pdf

离开meta的研究科学家和工程师包括原LLaMA论文的作者之一Timothée Lacroix、Guillaume Lample和Marie-Anne Lachaux。

他们现在在法国初创公司Mistral AI工作,该公司由Lacroix和Lample于6月共同创办。

还有其中的一位作者——meta AI的研究总监Armand Joulin已经在5月离开了meta,目前已加入苹果。

meta人工智能研究实验室「基础AI研究」的负责人Joelle Pineau在接受采访时表示:

meta正在面临的离职潮,恰恰凸显了大型科技公司在应对对人工智能人才需求激增的挑战。

大模型浪潮当前,各大科技公司唯恐落后,急于将AI接入自家产品和服务。

Riviera Partners的高管Kyle Langworthy称,「求贤若渴」的公司们,都排着队想挖角meta的人工智能研究人员。

2月份的时候,继LLaMA的发布点燃社区热情后,小扎曾连夜对外官宣了公司的大动作:成立顶级产品团队,专注AIGC。

简言之,小扎将meta未来的核心重点放在,生成式人工智能,以试图追赶谷歌、微软、OpenAI等竞争对手。

而曾经在2021年All In的「元宇宙」,也被放在了次要的位置。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

紧接着,meta时不时地发布并开源了在人工智能领域的最新研究,包括通用视觉模型SAM「分割一切」、多模态AI模型ImageBind、Llama2、Code Llama等等。

这些研究一经发布,都在开源社区引起了很大的反响,得到一致好评。

而现在,随着有经验的研究人员流失,meta在追赶竞争对手的路上多了一重阻碍。

那么,具体是怎么回事,让这些高级研究人员愤而离去?

LLaMA和OPT的算力之争

2013年,Yann LeCun入职meta后,担任AI研究主管时成立了人工智能研究实验室meta AI(原FAIR)。

除了在加利福尼亚州门洛帕克和纽约设立主要实验室(LeCun的所在地),meta AI还在蒙特利尔(Pineau的所在地)、巴黎、伦敦和西雅图设有分部。

meta AI实验室的成立,主要致力于AI的研究,将人工智能应用在翻译、MRI扫描等各种场景。

但是,ChatGPT横空出世之后,公司的高管们对AI更深层次融入产品的要求,变得更加急切。

其实,在ChatGPT发布之前,meta也一直在开发自己的LLM。

2022年5月,meta AI的一个北美团队对外公布,并开源了大模型OPT-175B。

meta声称,这个模型的能耗要比GPT-3低,尽管这两个模型在训练期间学习的内容,在数量上是一样的。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

几个月后,该团队开始着手开发第二个更大的模型,旨在与谷歌的PaLM竞争。

与此同时,另一个位于巴黎的meta AI团队,已经开始着手开发一个单独的大型语言模型,也就是LLaMA。

知情人士表示,这个模型比OPT要小。研究团队认为较小的模型在推理时会高效。

随之问题就来了,分别来自北美和巴黎两个实验室的团队,开启了获取算力资源之争,进而加剧了内部团队的纷争。

尤其是,LLaMA团队感觉自己被忽视了,自己的模型小,但获得的计算资源比北美的OPT团队少的多。

「基础AI研究」的负责人Joelle Pineau表示,

如果meta AI的员工就分配发生争议,就会提交到上级,也就是Pineau这一层去处理。

在采访中,Pineau承认在LLaMA和OPT团队之间在算力分配上有些紧张,并补充道,「我们试图找到一条路,听取每个人的发声,即使无法去满足每个人的需求。」

对某些研究人员来说,这感觉像是一场竞赛。

meta AI的一些高管也在质疑,为什么两个团队都做着相似的项目,但又互相竞争有限的资源。

2月巨变

两个团队之间的紧张关系,到今年2月达到了高潮。

恰在这个月,为了追赶竞争对手,meta AI首次将LLaMA作为开源模型发布,授权用于研究目的。

其实,在发布的前一周,meta AI的联合主管兼巴黎分部负责人Antoine Bordes就离开了meta,而对外的离职原因是⼯作时间与加州⼀样让自己筋疲⼒尽。

现在,Bordes已经加入了人工智能公司Helsing。

知情人士表示,他的离职进一步,让LLaMA团队与北美的高管隔离开来。另外,Pineau也承认了Bordes的离职为团队「带来了一些不确定性」。

这不仅仅是LLaMA团队研究士气受挫的问题,与此同时,OPT团队在过去几个月里,一直也在面临人员流失的问题。

据称,OPT团队正在研发的更大型的模型,直接被meta放弃。也不难理解,OPT的人员流失,和这个决定有着直接的关系。

根据研究作者linkedin个人资料,19位OPT论文的作者中,也有一半人已离职meta。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

论文地址:https://arxiv.org/pdf/2205.01068.pdf

「基础AI研究」的负责人Pineau无奈地表示,「当所有团队都想在这个时候升级模型,那时你要么选择其中一个,要么就让他们合作。」

团队重组,定位不清

在这一切发生的同时,meta AI也被公司的频繁地变动搞得焦头烂额。

自从去年11月开始,小扎进行了数次全公司范围的裁员。其中,meta AI也没能幸免。

今年2月,meta AI领导人决定将相互竞争LLaMA和OPT团队的一些成员聚集起来,正式成立「生成式AI」团队,(由前苹果高管Ahmad Al-Dahle负责),同时也从meta AI抽调了大量人员。

其实,我们在Llama2论文中,可以看到不少LLaMA和OPT作者的身影。

比如OPT的团队中,Moya Chen、Todor Mihaylov、Punit Singh Koura加入「生成式AI」团队。

初代LLaMA团队中,Hugo Touvron、Thibaut Lavril、Xavier Martinet、Marie-Anne Lachaux、Naman Goyal、Aurelien Rodriguez加入「生成式AI」团队。

有趣的是,在Llama2的致谢中,提到的4位最先发起这项研究的团队,其中三位已经离职,目前仅有Edouard Grave还在。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

尽管备受赞誉的开源模型LLaMA取得了不小的成功,但随着meta对人工智能研究态度的不断变化,研究人员之间的紧张关系仍在酝酿。

传统上来讲,meta AI拥有一种由研究人员主导的自下而上的文化,从而使团队能够专注于AI领域,并取得突破性的进展。

但随着小扎越来越倾向于将AI融入meta的应用程序之中,meta AI的关注点也随之缩小——解散了那些不以产品为导向的研究,比如蛋白质折叠。

与此同时,新的项目也在生成式AI团队和meta AI之间「反复横跳」。

比如,meta在7月发布的Llama2,以及在8月发布的专攻代码生成的Code Llama,就是分别由两个团队负责的。

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

LLaMA核心原作多半离职,Meta AI内幕曝光!算力争夺撕破脸,大模型团队成员连换三轮

对此,Pineau表示,「这个领域发展得实在是太快了,我们现在还在探索,哪个项目应该由meta AI来负责?哪个项目又该由生成式AI团队来负责?」

台前,开源模型光鲜靓丽,而幕后,AI研究人员离职潮涌、算力纷争、团队重组,为meta倾力AI赶超对手带来了许多不确定性因素。

参考资料:

https://www.theinformation.com/articles/inside-metas-ai-drama-internal-feuds-over-compute-power?rc=epv9gi

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年9月6日 18:13
下一篇 2023年9月6日 18:13

热点推荐

  • JoJoGAN:可一键生成艺术化面部图像的深度学习模型

    极客号(Daydx.com)9月19日 消息:JoJoGAN是一个深度学习模型,该模型可以将普通的面部图像转化为艺术化的作品,无需专业艺术家或设计师的干预。这项技术可用于各种应用领域,包括艺术创作、虚拟角色设计、社交媒体滤镜和广告…

    热点 2023年9月19日
    108
  • 五一机票酒店价格报复性上涨,五一你还愿意出去吗??

    我已经不愿意出去了,老老实实待在家胡里也挺好。受疫情的因素影响,大家应该都已经很久汽况间次帮啊很读限责没有出门旅行了,而来自今年五一假期由三天调整为五天,给了大家充足的时间外出旅行。被压抑的旅行需求加上时间的充裕,生活中有太多人都…

    2023年4月30日 热点
    105
  • 11日,山东1市新增1例本土无症状感染者

    11日,山东1市新增1例本土无症状感染者 2022年10月11日1时,滨州邹平市新增1例省外输入本土无症状感染者,系入鲁返鲁大货车司机“落地检”中发现。 10月10日19时,接外地协查通知,一名入鲁返鲁大货车司机“落地检”混管初筛…

    热点 2022年10月12日
    141
  • 黑皮肤女孩穿衣搭配图,皮肤黑的女生穿什么颜色衣服

    到了夏季,肯定又有很多女生开始烦恼,不知道该怎么穿衣服,特别是颜色的选择上更是纠结。毕竟在这个明亮的季节里,不可能总穿黑灰色的衣服,那会显得太过于沉闷压抑,难以凸显自己的气质与魅力。 但自己又属于黄黑皮,对颜色的选择又有所限制,怕…

    2022年10月1日 热点
    155
  • 联合调校天玑9200 !卢伟冰:与联发科立下“军令状”一定要打翻身仗

    快科技8月3日消息,今日下午,Redmi举行后性能时代战略发布会,正式宣布Redmi K60至尊版将在8月发布,该机定位性能之王”。 据悉,Redmi K60至尊版将搭载天玑9200 ,这次,Redmi与联发科深入底层进行调校。 …

    热点 2023年8月4日
    102
  • 别墅装修设计合同(装修设计合同)

    提起装修设计合同,大家都知道,有人问别墅装修设计合同,你知道这是怎么回事?其实别墅装修设计合同,下面就一起来看看装修设计合同,希望能够帮助到大家! 简易版装饰设计合同 简易版装饰设计合同范本 简易版装饰设计合同范本,在我们日常生活…

    热点 2023年4月21日
    116
  • 乒乓球桌标准尺寸多少,室内乒乓球桌标准尺寸规格

    家庭娱乐室是指在房屋某区间内设置的一个供家人娱乐运动的房间,根据主人的喜好,会有不同的功能室。 下面由华建工艺学会、华建环境设计研究所为大家讲述下乒乓球室尺寸设计! ▷目录 1、乒乓球台尺寸 2、乒乓球最小运动范围 3、乒乓球室设…

    2022年10月26日 热点
    227
  • 如何写出一篇好的新闻稿软文(软文推广怎么写)

    软文推广怎么写(软文推广:如何写出一篇好的新闻稿软文?) 随着互联网时代的到来,网络营销深受追捧,而新闻软文营销作为网络营销的重头戏而倍受推崇。其实,要写一篇高质量的新闻稿也不是容易的事,除了有深厚的文案策划功底外,必须具备有一个…

    热点 2022年10月10日
    167
  • 全国本土新增239+994

    (来源:江苏新闻广播) 9月9日0—24时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增新冠肺炎本土确诊病例239例(四川86例,内蒙古33例,广东26例,北京16例,西藏16例,山东13例,广西12例,河南9例,贵州5例…

    热点 2022年9月12日
    144
  • 心理小常识(心理小常识1000条)

    1、不要在流泪的时候做任何决定,情绪负面的时候说话越少越好。 2、不要去反复思考同一个问题,不要把所有的感情都放在一个人身上,你还有父母,还有其他朋友。 3、不要害怕做错什么,即使错了,也不必懊恼,人生就是对对错错,何况有许多事,…

    热点 2022年10月13日
    146

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注