谷歌推出最新的開源大模型—Gemma,它采用了與Gemini模型相同的研究和技術(shù)所構(gòu)建,但比Gemini更輕量級(jí)更先進(jìn)。
Gemma是一系列輕量級(jí)、最先進(jìn)的開放式模型,采用與創(chuàng)建Gemini模型相同的研究和技術(shù)而構(gòu)建。Gemma 由 Google DeepMind 和 Google 的其他團(tuán)隊(duì)開發(fā),其靈感來自 Gemini,其名稱反映了拉丁語gemma,意思是“寶石”。
什么是gemma
Gemma 是 Google AI 系列的最新成員,包括源自 Gemini 模型的相同技術(shù)的輕量級(jí)頂級(jí)開放模型。
Gemma不僅僅只有2B 和 7B這兩種規(guī)模,實(shí)際上是發(fā)布了Gemma系列(經(jīng)過預(yù)訓(xùn)練的變體和指令優(yōu)化的變體,大大小小50多種),Gemma 模型非常適合各種文本生成任務(wù),包括問答、總結(jié)和推理。
同時(shí),還能在Keras3.0(以集成主要框架JAX、PyTorch和TensorFlow)上用于推理和監(jiān)督微調(diào)(SFT)的工具鏈。以及提供了谷歌Colab和Kaggle筆記本快速部署代碼和HuggingFace等第三方AI平臺(tái)的集成,使用戶能快速上手體驗(yàn)。
功能介紹
1.以兩種規(guī)模發(fā)布模型尺寸:Gemma 2B和Gemma 7B。每種規(guī)模都發(fā)布了預(yù)訓(xùn)練和指令調(diào)優(yōu)的變體。
2.一個(gè)新的負(fù)責(zé)任的生成式AI工具包提供了指導(dǎo)和必要工具,用于使用Gemma創(chuàng)建更安全的AI應(yīng)用。
3.為所有主要框架提供了推理和監(jiān)督式微調(diào)(SFT)的工具鏈:通過原生Keras 3.0支持JAX、PyTorch和TensorFlow。
4.隨時(shí)可用的Colab和Kaggle筆記本,以及與流行工具(如Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM)的集成,使得開始使用Gemma變得簡(jiǎn)單。
5.預(yù)訓(xùn)練和指令調(diào)優(yōu)的Gemma模型可以在您的筆記本電腦、工作站或Google Cloud上運(yùn)行,通過Vertex AI和Google Kubernetes Engine(GKE)輕松部署。
6.在多個(gè)AI硬件平臺(tái)上的優(yōu)化確保了行業(yè)領(lǐng)先的性能,包括NVIDIA GPU和Google Cloud TPU。
尺寸性能
Gemma 模型與Gemini共享技術(shù)和基礎(chǔ)設(shè)施組件,Gemini 是我們當(dāng)今廣泛使用的最大、功能最強(qiáng)大的 AI 模型。與其他開放式型號(hào)相比,這使得 Gemma 2B 和 7B 能夠在其尺寸范圍內(nèi)實(shí)現(xiàn)同類最佳的性能。Gemma 模型能夠直接在開發(fā)人員筆記本電腦或臺(tái)式計(jì)算機(jī)上運(yùn)行。值得注意的是,Gemma 在關(guān)鍵基準(zhǔn)上超越了更大的模型,同時(shí)遵守關(guān)于安全和負(fù)責(zé)任的輸出的嚴(yán)格標(biāo)準(zhǔn)。有關(guān)性能、數(shù)據(jù)集組成和建模方法的詳細(xì)信息。
設(shè)計(jì)更加負(fù)責(zé)
Gemma 的設(shè)計(jì)以人工智能原則為核心。為了使 Gemma 預(yù)訓(xùn)練模型安全可靠,使用自動(dòng)化技術(shù)從訓(xùn)練集中過濾掉某些個(gè)人信息和其他敏感數(shù)據(jù)。此外,利用人類反饋 (RLHF) 進(jìn)行廣泛的微調(diào)和強(qiáng)化學(xué)習(xí),使指令調(diào)整模型與負(fù)責(zé)任的行為保持一致。為了了解和降低 Gemma 模型的風(fēng)險(xiǎn)狀況,進(jìn)行了穩(wěn)健的評(píng)估,包括手動(dòng)紅隊(duì)、自動(dòng)對(duì)抗測(cè)試以及危險(xiǎn)活動(dòng)模型能力評(píng)估。
跨框架、工具和硬件進(jìn)行優(yōu)化
可以根據(jù)自己的數(shù)據(jù)微調(diào) Gemma 模型,以適應(yīng)特定的應(yīng)用程序需求,例如摘要或檢索增強(qiáng)生成 (RAG)。Gemma 支持多種工具和系統(tǒng):
多框架工具:帶上您最喜歡的框架,以及跨多框架 Keras 3.0、本機(jī) PyTorch、JAX 和 Hugging Face Transformers 進(jìn)行推理和微調(diào)的參考實(shí)現(xiàn)。
跨設(shè)備兼容性: Gemma 模型可以跨流行的設(shè)備類型運(yùn)行,包括筆記本電腦、臺(tái)式機(jī)、物聯(lián)網(wǎng)、移動(dòng)設(shè)備和云,從而實(shí)現(xiàn)廣泛的 AI 功能。
尖端硬件平臺(tái):針對(duì) NVIDIA GPU 優(yōu)化 Gemma,從數(shù)據(jù)中心到云端再到本地 RTX AI PC,確保行業(yè)領(lǐng)先的性能并與尖端技術(shù)集成。
針對(duì) Google Cloud 進(jìn)行了優(yōu)化: Vertex AI 提供了廣泛的 MLOps 工具集,其中包含一系列調(diào)整選項(xiàng)以及使用內(nèi)置推理優(yōu)化的一鍵部署。完全托管的 Vertex AI 工具或自我管理的 GKE 提供高級(jí)自定義功能,包括從任一平臺(tái)跨 GPU、TPU 和 CPU 部署到經(jīng)濟(jì)高效的基礎(chǔ)設(shè)施。
Gemma是Google在2024年2月21日推出的一個(gè)新項(xiàng)目,旨在為用戶提供豐富的提示、代碼示例和集成方案,以便深入了解和使用這一平臺(tái)。通過我們的初步測(cè)試,我們發(fā)現(xiàn)Gemma在運(yùn)行時(shí)需要一定的時(shí)間。這不僅反映了其強(qiáng)大的功能和復(fù)雜的算法,也意味著用戶在使用過程中需要耐心等待,以充分發(fā)揮Gemma的潛力。Google提供的資源非常有助于縮短學(xué)習(xí)曲線,讓用戶能夠更快地掌握Gemma的使用方法,并有效地將其應(yīng)用于各種項(xiàng)目中。
微信公眾號(hào)
業(yè)務(wù)咨詢:400-9969-069(24小時(shí)服務(wù)) 028-86052918
售后熱線:028-86052836
公司地址:成都市武侯區(qū)天益街38號(hào)理想中心3棟1810