Meta推新一代開放式大型語言模型 推理能力更強

分享到

(中央社記者吳家豪台北19日電)Facebook(臉書)母公司Meta今天推出新一代開放式大型語言模型Llama 3,初始的2個模型已可使用,包含預訓練和指令微調的語言模型,其中的8B(80億)和70B(700億)參數,可支援更多元的使用情境,提供更精準的推理能力。

Meta發布新聞稿指出,希望透過建立Llama 3回應開發人員的意見,並提高Llama 3的整體實用性,同時持續負責任地使用並部署大型語言模型。新模型也將釋出供社群運用,鼓勵開發者開始建立專屬內容。

Meta表示,今天推出以文字為基礎的模型,為Llama 3系列的第一波模型。Meta期待讓Llama 3在近期具備多語言和多模態、有更長的上下文語境,繼續提升推理和編寫程式碼等核心大型語言模型能力的整體表現。

隨著生成式AI(人工智慧)領域迅速發展,Meta認為,開放方式是整合生態系並減輕潛在危害的重要途徑之一。身為生態系一員,Meta正在更新負責任使用指南(Responsible Use Guide,RUG),提供負責任地開發大型語言模型的全面性指南。(編輯:林淑媛)1130419