谷歌新小型AI模型Gemma 2 2B超越OpenAI的GPT3.5
谷歌刚刚发布了其最新的人工智能模型 Gemma 2 2B,这是一款轻量级人工智能模型,据报道,它在关键基准测试中的表现优于 GPT-3.5 和 Mistral 8x7B 等大型模型。在发布 Gemma 2同类最佳模型几周后,谷歌又发布了内置安全改进的 Gemma 2 2B。除了 Gemma 2 2B,谷歌还宣布了新增的 ShieldGemma 和 Gemma Scope。
谷歌在官方发布的内容中表示:“通过这些新增功能,研究人员和开发人员现在可以创造更安全的用户体验,让我们的模型获得海底的洞察力,并自信地在设备上明智地部署强大的的人工智能,为创新释放新的可能性。”
Gemma 2 2B 是什么?
据谷歌称,Gemma 2 2B 是一款轻量级模型,通过提炼从更大的模型中学习,从而产生超乎寻常的结果。该公司称,Gemma 2 2B 在 Chatbot Arena 上超越了所有 GPT-3.5模型,展示了卓越的对话式AI能力。
谷歌表示,新模型可以在各种硬件上运行,从边缘设备和高性能笔记本电脑到具有 Vertex AI 和 Google Kubernetes Engine (KGE) 的强大云部署。该模型还利用 NVIDIA TensorRT-LLM 库进行了优化,以提高其速度。Gemma 2 2B 与 Keras、JAX、Hugging Face、NVIDIA NeMo、Ollama、Gemma .cpp 无缝集成,并很快在 MediaPipe 平台上推出,以简化开发。该模型是进一步开放且可访问的。
有何不同?
Gemma 2 2B 仅配备 2.6B 个参数,但它是在 2 万亿个代币的庞大数据集上进行训练的。在 Chatbot Arena 上,该模型的得分为 1130,与 GPT-3.5 Turbo 和 Mixtral – 8x7b的得分相当,而生日比 Gemma 2 2B 的大倍数。
在MMLU(大规模多任务语言理解)方面,该模型获得了 56.1 分,在 MBPP(大多数基本 Python 问题)方面获得了 36.6 分。报告报道,凭借这些分数,新模型比其前面的分数出 10%由于它是开源的,开发人员可以从 Google 的公告页面下载该模型。
版权声明:本文由用户上传,如有侵权请联系删除!