多模态又磨真金不怕火算力了!ChatGPT文生图功能太火爆 奥尔特曼:GPU“冒烟了”
跟着OpenAI的图像生告捷能完成要紧升级,新的问题出现了。
OpenAI创举东说念主Sam Altman暗示:ChatGPT的文生图应用需求过高,咱们的GPU“冒烟了”(melting,原为熔解之意),在勤快进步后果的同期,将暂时对ChatGPT生成图片的功能引入一些速度罢休。


这意味着,OpenAI将对ChatGPT的图像生告捷能现实临时限速,缩短单元时安分的央求处理量,缓解GPU过载压力,并优先保险文本生成、对话等中枢功能的踏实性,好像将暂时放缓图像生成的工夫优化节律。
此前3月26日,OpenAI推出基于GPT-4o模子的图像生告捷能——Images in ChatGPT,用户可在ChatGPT及Sora平台径直通过当然言语辅导生成、剪辑图像,救助多轮迭代优化。这秀美着ChatGPT认真将文本、图像、代码等多模态智商深度整合,达成从单一言语模子向全模态智能体的登程点。
该功能上线后,以“动动嘴就能P图”的便利连忙火爆,互联网平台上涌入大宗由个东说念主相片、著名梗图挪动而来的“吉卜力”卡通作风图片。连Altman也热爱起该功能带来的泼天流量:“我方往时十年安常守分作念AI,试图匡助达成超等智能来和谐癌症之类的事情。前7.5年险些无东说念主问津,接下来的两年半,作念什么齐会引来所有东说念主的厌恶。然后某天醒来收到几百条音信,东说念主们告诉你被画成了吉卜力作风的好意思少年。”

Sam Altman在外交平台上的新头像,生成自Images in ChatGPT

生成自Images in ChatGPT

生成自Images in ChatGPT
与此同期,由于图像生告捷能的受迎接进度远超预期,OpenAI原来盘算推算本周向所灵验户推送这项功能,但现时“被动”推迟了向免用度户洞开新功能的时分。
与行为扩散模子开动的DALLE压根永诀是,GPT-4o图像生成是原生镶嵌在ChatGPT中的自回来模子。OpenAI笔据在线图像和文本的勾通分发来磨真金不怕火模子,投资期货使得模子不错学习图像与言语的联系,使其生成灵验、一致且具备高下文感知的图像。
GPU就像一群超等快的“画师”,能同期处理大宗计较任务,生成图片(如DALLE、Stable Diffusion)需要AI逐像素计较,每一步齐要处理海量数据。而让AI生成更精准、更高清的图像依赖于GPU的大限制并行计较。OpenAI提到,因为这个模子会创建更注主义图片,是以图像需要更长的渲染时分,频繁会达到一分钟。
如斯一来,文生图功能的用户越多,需要的GPU算力成倍增长。
处罚方式主要有两种,更强的GPU或更高效的AI模子,前者走“力大砖飞”路子,后者寄但愿于算法的优化,即通过考订AI算法让相同的GPU能处理更多任务(比如用更小的模子或压缩工夫)。
行为AI边界的头部玩家,OpenAI背后的GPU储备当然是业内顶尖水准。笔据工夫究诘公司Omdia的分析,微软行为OpenAI的主要投资者,在2024年购买了约48.5万块英伟达的Hopper芯片,是其主要竞争敌手Meta的两倍,这使其成为英伟达GPU的最大买家。OpenAI的大模子恰是用微软的Azure云基础形状进行磨真金不怕火。
不错说,OpenAI因新功能濒临的问题,折射了AI多模态工夫发展中的资源与需求均衡费力,一方面,AI应用对GPU等算力资源的需求仍是高大,另一方面,行业链接呼叫工夫迭代,以求高效把握现存资源。