蘋果發佈可直接在裝置運行的開源 LLM AI 模型 OpenELM
蘋果發佈了幾款設計於裝置上運行的開源大型語言模型,
而不是透過雲端服務。這些模型統稱為 OpenELM,
並已在Hugging Face Hub 上提供,該平台是一個共享人工智能代碼的社區。
蘋果 (AAPL-US)
蘋果在開源 AI 平台 Hugging Face 上發布一個具有開源訓練和推理框架的高效語言模型,名為 OpenELM。
據了解,OpenELM 有四種尺寸:2.7 億、4.5 億、11 億和 30 億個參數版本,定位於超小規模模型,
而微軟 Phi-3 模型為 38 億。 這種小模型運行成本更低,可在手機和筆記型電腦等設備上運行。
同時,在 WWDC24 開發者大會之前,蘋果徹底開源了 OpenELM 模型權重和推理程式碼,
資料集和訓練日誌等。 而且,蘋果還開源了神經網路庫 CoreNet。
OpenELM 支援 iPhone 或 Mac 電腦
蘋果在 OpenELM 公開說明中提到 「將模型轉換為 MLX 資料庫的程式 碼,
以便在蘋果設備上進行推理和微 調」,其中 MLX 是去年釋出能在蘋 果晶片上運行機器學習的框架,
能夠 在非連網路狀態下,直接透過蘋果設 備本機執行。
蘋果一直都是封閉系統領導者,如今 罕見公開 AI 大模型,
外界認為這有 可能就類似 Google 操作方式,
先透過 開源拉攏開發人員,再利用封閉產品 進行商業化。
OpenELM 有哪些亮點?
據蘋果官方所述,OpenELM 是一種 最先進的開放語言模型。
OpenELM 使用分層縮放(layer-wise scaling)策 略來有效地分配變壓器模型每一層 內的參數,
從而提高準確性。例 如,在參數預算約為 10 億個參數的 情況下,
OpenELM 與 OLMo 相比, 精度提高了 2.36%,同時所需的預訓 練令牌減少了 2 倍。
此外,「與先前僅提供模型權重和 推理程式碼以及在私人資料集上進 行預訓練的做法不同,
我們的版本 包括在公開資料集上訓練和評估語 言模型的完整框架,
包括訓練日 誌、多個檢查點和預訓練。我們還 發布了將模型轉換為 MLX 庫的程式 碼,
以便在 Apple 裝置上進行推理和 微調。
這一全面的發布旨在增強和 加強開放研究社區的力量,為未來 的開放研究努力鋪平道路。」
太平總店 (台哥大斜對面&耀仁診所旁)
【門市地址】台中市太平區樹孝路39-6號
【門市電話】(04)2393-4002
【營業時間】中午12:00-晚上9:00
豐原店 (711對面&50嵐隔壁)
【門市地址】台中市豐原區三民路114號
【門市電話】(04)2525-7557
【營業時間】中午12:00-晚上9:00
逢甲店 (西屯路&逢甲路交叉口)
【門市地址】台中市西屯區逢甲路167號
【門市電話】(04)2700-0040
【營業時間】中午12:00-晚上9:00
台中店 (公益路&精誠路交叉口)
【門市地址】台中市西區精誠路105-5號
【門市電話】(04)2320-0851
【營業時間】中午12:00-晚上9:00