首页 > 生活分享 > 免费教学 > 90/270亿参数,谷歌发布Gemma 2 AI大语言模型

90/270亿参数,谷歌发布Gemma 2 AI大语言模型

发布时间:2024-06-28 22:52:09

 6 月 28 日消息,谷歌公司昨日发布新闻稿,面向全球研究人员和开发人员发布 Gemma 2 大语言模型,共有 90 亿参数(9B)和 270 亿参数(27B)两种大小。

Gemma 2 大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。

谷歌在新闻稿中表示,Gemma 2-27B 模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达 H100 ensor Core GPU 或 TPU 主机就能实现这种性能,从而大大降低了部署成本。

Gemma 2-9B 模型优于 Llama 3 8B 和其他类似规模的开源模型。谷歌还计划在未来几个月发布参数为 26 亿的 Gemma 2 模型,更适合智能手机的人工智能应用场景。

谷歌表示为 Gemma 2 重新设计了整体架构,实现卓越的性能和推理效率。IT之家附上 Gemma 2 主要特点如下:

性能优异:

27B 版本在同规模级别中性能最佳,甚至比两倍于其尺寸的机型更具竞争力。9B 版本的性能在同类产品中也处于领先地位,超过了 Llama 3 8B 和其他同规模的开放模型。

效率和成本:

27B Gemma 2 模型可在单个谷歌云 TPU 主机、英伟达 A100 80GB Tensor Core GPU 或英伟达 H100 Tensor Core GPU 上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得人工智能部署更容易实现,预算也更合理。

跨硬件快速推理

Gemma 2 经过优化,可在各种硬件(从功能强大的游戏笔记本电脑和高端台式机到基于云的设置)上以惊人的速度运行。

在 Google AI Studio 中尝试全精度的 Gemma 2,在 CPU 上使用 Gemma.cpp 的量化版本解锁本地性能,或通过 Hugging Face Transformers 在配备 NVIDIA RTX 或 GeForce RTX 的家用电脑上进行尝试。

免费教学更多>>

Uber计划2026年底前在15城推出自动驾驶出租车服务,Q4及Q1盈利预期未达市场预期 起亚宣布2026款Niro插电混动版将退出美国市场 印度车企1月销量普遍增长,SUV与电动车成主要驱动力 原力无限—小原子(YUANZI)首日盲订即突破100台 欧盟、日本与美国就关键矿产供应链韧性建立战略伙伴关系 定义行业新节点:德赛西威发布首款8T8R 4D毫米波雷达 李想:全新理想L9不仅是好车,更是具身智能机器人开山之作 俄罗斯2026年1月汽车市场多品类销量同比下滑,商用车降幅显著 广汽高域飞行汽车AirCab,斩获33亿元订单! 中科创达旗下晓悟智能与北京人形机器人创新中心达成战略合作 重庆国资出手,入股一家做“机器人大脑”的公司 一汽红旗全固态电池首台样车成功下线 瑞虎系又多一家企业IPO,目前已过会 离子能源公司完成数亿元Pre-A轮融资 小米前高管创业,获高瓴、智元等数千万掷投 马自达押油电混合:下一代纯电推迟至2029年 2025越南车市大反转,“丰田们”的时代变了 启境汽车发布第三期网友问答,线下服务网络规划明确 新款比亚迪海豹06 EV正式进入工信部目录,新车将有望在年内上市 大鹏展翅已高飞?方程豹钛7,单月销量升至3.4万台 精准踩中用户痛点 合资新车智能焕新 春节购车必看 冰雪试驾别克至境世家:在冰面上,你会忘了这是一台新能源大型 比亚迪放大招:宋Pro DM-i 220km版是否诚意过头? 凭实力精准卡位,HR-V打造十万元级SUV新标杆 苦走10年投融路,李斌热泪盈眶:今天,我们终于赢了! 售价 30 万元以上市场分析 奔驰品牌销量与成交均价居前 奇 瑞or比亚迪,谁将成为2026海外第一? 降幅垫底:广汽本田 5 年“ 5 连降”,高洪祥难为无米之炊? 日产全新轩逸量产下线!前脸升级V型,颜值飙升不少,一季度上市 小鹏汽车2026全球新品发布会重磅来袭,四款新车开启AI出行新时代