谷歌新小型AI模型Gemma 2 2B超越OpenAI的GPT3.5

编辑： • 来源： • 2024-08-07 11:20:10

谷歌刚刚发布了其最新的人工智能模型 Gemma 2 2B，这是一款轻量级人工智能模型，据报道，它在关键基准测试中的表现优于 GPT-3.5 和 Mistral 8x7B 等大型模型。在发布 Gemma 2同类最佳模型几周后，谷歌又发布了内置安全改进的 Gemma 2 2B。除了 Gemma 2 2B，谷歌还宣布了新增的 ShieldGemma 和 Gemma Scope。

谷歌在官方发布的内容中表示：“通过这些新增功能，研究人员和开发人员现在可以创造更安全的用户体验，让我们的模型获得海底的洞察力，并自信地在设备上明智地部署强大的的人工智能，为创新释放新的可能性。”

Gemma 2 2B 是什么?

据谷歌称，Gemma 2 2B 是一款轻量级模型，通过提炼从更大的模型中学习，从而产生超乎寻常的结果。该公司称，Gemma 2 2B 在 Chatbot Arena 上超越了所有 GPT-3.5模型，展示了卓越的对话式AI能力。

谷歌表示，新模型可以在各种硬件上运行，从边缘设备和高性能笔记本电脑到具有 Vertex AI 和 Google Kubernetes Engine (KGE) 的强大云部署。该模型还利用 NVIDIA TensorRT-LLM 库进行了优化，以提高其速度。Gemma 2 2B 与 Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma .cpp 无缝集成，并很快在 MediaPipe 平台上推出，以简化开发。该模型是进一步开放且可访问的。

有何不同?

Gemma 2 2B 仅配备 2.6B 个参数，但它是在 2 万亿个代币的庞大数据集上进行训练的。在 Chatbot Arena 上，该模型的得分为 1130，与 GPT-3.5 Turbo 和 Mixtral – 8x7b的得分相当，而生日比 Gemma 2 2B 的大倍数。

在MMLU(大规模多任务语言理解)方面，该模型获得了 56.1 分，在 MBPP(大多数基本 Python 问题)方面获得了 36.6 分。报告报道，凭借这些分数，新模型比其前面的分数出 10%由于它是开源的，开发人员可以从 Google 的公告页面下载该模型。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：

谷歌新小型AI模型Gemma 2 2B超越OpenAI的GPT3.5

猜你喜欢

最新文章