起头:财联社
好多东谈主工智能(AI)科学家和初创公司合计,通过加多更多数据和算力来扩大现时模子,以握续检阅AI模子的门径正在走到至极。因此,像OpenAI这么的AI公司正在寻求通过配置新的进修手艺来克服现时边临的挑战,这些手艺更像东谈主类的想考边幅。
自风靡公共的聊天机器东谈主ChatGPT发布以来,科技公司皆是通过加多更多数据和算力来扩大并改善AI模子。但当今,一些最凸起的AI科学家正在指出这种“越大越好”的局限性。
东谈主工智能践诺室Safe Superintelligence和OpenAI的聚始首创东谈主Ilya Sutskever近日默示,扩大预进修(进修AI模子的阶段,该模子使用多数未标记的数据来明白讲话口头和结构)所取得的恶果也曾达到了一个牢固期,对擢升模子性能的匡助有限。
Sutskever早期目标通过在预进修中使用更多数据和算力来达成生成式AI的渊博飞跃,这最终创造了ChatGPT。他本年早些时候离开OpenAI,创立了Safe Superintelligence。
Sutskever默示:“往时是界限延迟的时期,当今咱们又回到了名胜和发现的时期。每个东谈主皆在寻找下一个东西,这比以往任何时候皆更蹙迫。”
此外,Sutskever还承认他的公司正在野心一种扩大预进修界限的替代门径,但未透露更多细节。
新手艺竞赛
大模子的所谓“进修”需要同期动手数百个芯片,本钱可能高达数千万好意思元。计议到系统的复杂性,它们更有可能出现硬件导致的故障;在测试截止之前,野心东谈主员可能无法知谈这些模子的最终性能,这可能需要几个月的时辰。
另一个问题是,大讲话模子吞吃了多数数据,而AI模子也曾糜掷了宇宙上所有容易赢得的数据。电力清寒也进军了进修动手,因为这个经过需要多数的动力。
为了克服这些挑战,野心东谈主员正在探索测试时计划(test-time compute),这是一种在所谓的推理阶段或使用模子时增强现存AI模子的手艺。举例,模子不错及时生成和评估多种可能性,最终选拔最好前进旅途,而不是立即选拔一个谜底。
这种门径使模子大约将更多的搞定才智参加到具有挑战性的任务中,比如数学或编码问题或需要相似东谈主类的推理和有规划的复杂操作。
OpenAI野心员Noam Brown此前默示:“事实阐述,让一个机器东谈主在一盘扑克牌中想考20秒,与将模子放大10万倍、进修时辰延长10万倍的效果疏通。”
OpenAI 在其新发布的模子“o1”中继承了这项手艺,与此同期,来自Anthropic、xAI和DeepMind等其他顶尖AI践诺室的野心东谈主员也在竭力于配置我方的手艺版块。
OpenAI首席居品Kevin Weil默示:“咱们看到了好多低落的果实,摘下来让这些模子变得更好。比及东谈主们奋发自强的时候,咱们会辛勤配置新的手艺。”
多位科学家、野心东谈主员和投资者合计,这种新手艺可能会重塑AI武备竞赛,并对AI公司所需求的各样资源产生影响。
海量资讯、精确解读,尽在新浪财经APP株连剪辑:丁文武