登录
首页 > 凯美瑞 > Google 不只挑战 OpenAI,还有英伟达

Google 不只挑战 OpenAI,还有英伟达

发布时间:2023-12-08 11:34:14 发布用户: 15210273549

没有精心准备的发布会,没有声势浩大的宣传,凭借一篇博客文章、一份技术报告,全球大模型的格局可能又一次被改变。

 

当地时间 12 月 6 日,Google 发布三个版本的多模态大模型 Gemini(双子座),其中的 Gemini Ultra 版本对标最强大模型 GPT-4。Google CEO 桑达尔·皮查伊 (Sundar Pichai) 说:“这是我们迄今为止功能最强大、最通用的模型,在许多领先的基准测试中都领先。”

 

- Gemini Ultra,参数规模最大、效果最好。Google 没有透露具体参数量,业内人士估计超过了万亿。性能对标 GPT-4 的大模型。

- Gemini Pro,参数比 Ultra 版本少,优化推理成本,是 Google 在内部部署、对外提供服务的主力版本。现在已经应用于 Google 聊天机器人 Bard。

- Gemini Nano,专门为移动设备训练的模型。针对不同内存的设备,训练了两个版本,参数量分别是 18 亿和 32.5 亿。

 

相比新模型在一些评测指标上追平甚至超过 GPT-4,Google 训练这个大模型的过程和方法,也许对整个大模型行业的影响更大。

 

作为由 Google 自研 TPU v4 和 TPU v5e 训练出来的大模型,三个版本的 Gemini 各有侧重,共同打破了之前的局限 —— 挑战 OpenAI 的同时,还有可能撼动英伟达在 AI 芯片的垄断地位。

 

 

Gemini Ultra 让 Google 进入大模型一梯队

 

 

按照 Google 的说法,Gemini Ultra 在 30 项大模型能力测试中超过此前最强的大模型 GPT-4,在检验大模型数学、历史、物理、法律等 57 个学科知识水平的 MMLU 测试中评分达到 90%,是第一个超过人类专家的模型。

 

 

Gemini Ultra 在多项测评中超过了 GPT-4。左图是文本能力,右图是图片、视频、音频能力。图片来自 Google。

 

Google CEO 皮查伊用一段绘画视频展示了 Gemini Ultra 不同维度下的理解能力。当真人一边画鸭子一边与之说话时,大模型可以理解人类的每一步在做什么,并精确地说出来。

 

比如给鸭子涂蓝色的时候,大模型会说 “鸭子看上去是蓝色的”,接着在没有接受新提示指令的情况下,指出蓝色鸭子不常见。

 

但这个最强版本的 Gemini 要到明年才会向公众开放,它真实效果能否超过 GPT-4 还有待验证。桑达尔·皮查伊在接受采访时解释,花更多时间是为了严格的安全测试,并挖掘它真正的功能。此前 OpenAI 训练完 GPT-4 后,花了半年时间做类似的事情。

 

另外两个参数更小版本的大模型已经以不同形式发给用户和开发者。Android 开发者已经能在 Google 的手机 Pixel 8 Pro 上使用 Gemini Nano 开发应用;Pixel 8 Pro 用户也可以用它总结录音纪要等。

 

同时,Google 把自己聊天机器人 Bard 背后的模型从原来的 PaLM 2 换成了 Gemini Pro。一些开发者测试后发现,效果虽然比原来的版本更好,但与 GPT-4 相比有不小的差距,甚至一些人说它只是 GPT-3.5 的水平。

 

看着 Google 的最新成果,人工智能领域专业人士和局外的华尔街多少有些淡漠。一些人工智能专家都没有像看到 GPT-4 时那样,感叹技术有了如此大的进步,而只是说 Google 回来了。在他们看来 Google 早该做到这些。

 

这似乎可以用来解释为什么 Google 盘后股价跌幅(0.74%)超过了纳斯达克指数。不过,这已经比它们年初发布聊天机器人 Bard 时好了 —— 那一次 Google 股价重挫 7.4%。

 

在人工智能浪潮中,Google 一直处于独特的位置。它是最早研究人工智能、也是技术实力最强的公司之一,拥有许多人工智能底层技术的专利。在 Google 的技术报告中,署名的 Gemini 贡献者有 837 人,比 OpenAI 整个公司的人(770)都多。

 

它也是世界上最大互联网公司,每天服务数十亿人。它拥有的 Andriod 能直接影响全球 30 多亿人使用的手机。它比其他公司都更有能力收集海量的数据,不仅是文本,还有视频(YouTube)。

 

在基础设施层面,它已经研发人工智能芯片八年,很快将拥有世界上最多的人工智能算力。OpenAI 成立的原因之一,就是为了阻拦强大的人工智能只落在 Google 手中 —— 联合微软、英伟达,OpenAI 阶段性实现了这一目标。

 

Google 在云计算之后,再一次起了个大早、赶了个晚集。不过,它现在也有机会展示人工智能芯片的新选择:不用顶级 GPU,也可以训练出顶尖的大模型。

 

 

用自研 TPU 训练出顶级大模型,挑战英伟达

 

 

这次发布会上,Google 还带来新款 AI 芯片 TPU v5p,据称训练效果是上一代产品 TPU v4 的两倍。

 

只看单颗芯片性能,Google 训练出 Gemini Ultra 的芯片 TPU v4、TPU v5e,比不上英伟达的旗舰芯片 H100,各项性能指标最多只有英伟达三年前发布的 A100 的六成。

 

而且仅凭单个芯片或几十个芯片,已经很难训练参数规模动辄数十亿、上千亿甚至万亿的人工智能模型。据芯片研究机构 Semianalys 的首席分析师迪伦·帕特尔(Dylan Patel)估算,OpenAI 去年训练 GPT-4 动用了 2.5 万颗 A100 芯片,耗时三个多月。

 

Google 擅长把上千块 AI 芯片连接在一起,组成一个强大的算力平台。它 2015 年开始自研芯片,两年后就发布了 TPU 组建的训练集群(Pod),供庞大的内部业务(YouTube、Gmail、Google Map、Android)使用,一直迭代到现在。

 

“对于人工智能基础设施而言,系统能力比微架构更加重要。” 帕特尔说。Google 并没有公布训练 Gemini 动用了多少 TPU,只是强调动用了不只一个集群,甚至不只一个数据中心。

 

一个 TPU v4 集群最多有 4096 块芯片。帕特尔估计,Gemini 的 1.0 版本使用了 14 个 TPU v4 集群,耗费算力已经超过 GPT-4;而基于 TPU v5p 集群的 Gemini 的迭代版本(预计今年底完成预训练),消耗的算力可能是 GPT-4 的 5 倍。

 

原本受芯片、训练集群之间数据传输的带宽、甚至是宇宙射线影响(高能粒子穿透大气层,会影响芯片性能),利用大量芯片训练单个模型会提高故障率,硬件利用率也会大打折扣。但 Google 可以靠着更强的基础软件研发能力,尽可能让每个芯片都发挥作用。

 

Google 在技术报告中介绍如何训练 Gemini 时,一段话提及了三个训练框架——TensorFlow(其中的 XLA)、JAX、Pathways,都是 Google 自研的。

凯美瑞更多>>

江西新余:2026年底实现“保交楼”“保交房”项目全面清零 爱上一个人,与她有关 贵州六盘水:提高住房公积金贷款额度,买绿色建筑最高额度可上浮20% 科斯塔止住C罗的眼泪,乌龙球是法国最好的前锋 上合峰会召开在即,中俄都确认出席,印度却成为,最大不稳定因素 内卷之争,阿尔法T5能否跑赢零跑C11? 比老款低1.3万,售9.69万起!2024款吉利ICON玲珑值得买? 广汽传祺新能源成都机场路体验中心盛大开业 这几款合资燃油车已经降到几万块了,现在是入手好时机吗? 真玩家的大玩具,不止积木还有TA!“飞度改造工作坊”广州举行 汽车保值率也能卷?看看上汽大众怎么做 智己L6新增车型上市,具有超强续航 至高优惠4万元,北京EU5 PLUS,4门5座三厢车,标配声纹识别 为什么说吉利银河E5,是一款值得让你等待的纯电SUV? 长城SUV的销冠,哈弗H6月销还能勉强破万,需要迭代 明知有雷偏要踩,捷途直播间被封号,这回果然翻车了 买车等6月端午,买车来“2024 CMS杭州车展” 新能源车渗透率、上险量均超50%,燃油车还有未来吗? 电比油低 荣耀双出击|比亚迪汉EV荣耀版实力征服全场 燃擎赛道,巅峰对决 红旗品牌征战2024年CEC 一场马拉松,诠释长城汽车造车之路 212从战场到市场,传奇不灭的越野之魂 标配全景天窗+铝合金防撞梁,吉利新博越L到店实拍,11.57万元起 英菲尼迪:拿什么坚守中国市场? 限时10.98万起,与宋Pro DM-i同价硬刚,荣威D5X DMH胜算几何? 一季度单车均价升至10.4 万,零跑冲击5-10%毛利率目标 “绿带行动”——大众汽车集团(中国)公益林项目走进内蒙古巴彦淖尔 售价20.08万-25.58万,沃尔沃北欧高智感纯电SUV EX30上市 “肥女”来河南,现代雕塑艺术与中原古代艺术瑰宝的交融 《庆余年》外还有个多少王启年?“龙套王”谈龙套的自我修养
Copyright 2014-2023 新车测评网 版权所有  京ICP备18049689号-26