谷歌公司6日宣布推出一種名為Gemini的新人工智能模型,聲稱該模型在一系列智力測試中的表現優于OpenAI的GPT-4模型和“專家級”人類。
Gemini可處理文本、音頻和視頻。 圖片來源:谷歌公司
Gemini已針對不同的應用創建了3個版本,分別是Nano、Pro和Ultra。谷歌拒絕回答有關Pro和Ultra的規模、它們包含的參數數量、訓練數據的規模或來源等問題。
其最小版本Nano旨在在智能手機上運行,實際上有兩種模型:一種用于速度較慢的手機,擁有18億個參數;另一種用于功能更強大的手機,擁有32.5億個參數。據傳GPT-4包含多達1.7萬億個參數,而Meta的LLAMA-2則包含700億個參數 。
谷歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,例如OpenAI的GPT3.5,但更強大的Ultra超過了所有現有AI模型的能力。它在行業標準MMLU基準上的得分為90%,而“專家級”的人類預計能達到89.8%。
這是人工智能首次在測試中擊敗人類,也是現有模型中得分最高的。該測試涉及一系列棘手的問題,主題包括邏輯謬誤、日常場景中的道德問題、醫療問題、經濟和地理。
在同一測試中,GPT-4的得分為87%,LLAMA-2的得分為68%,Anthropic Claude 2的得分為78.5%。Gemini在其他9項常見基準測試中的8項中擊敗了所有這些模型。
去年,谷歌“深度思維”發布了一款名為AlphaCode的人工智能代碼生成器,它可擊敗50%的人類開發人員,而新發布的Gemini聲稱可擊敗85%的人類編程師。
谷歌“深度思維”的艾力·柯林斯表示,Gemini“幾乎在每個領域都是最先進的”。