【財新網(wǎng)】MiniMax向模型市場交出新答卷。10月27日,MiniMax發(fā)布開源推理大模型M2,采用混合專家模型(Mixture-of-Experts, MoE)架構,總參數(shù) 2300億,激活參數(shù)100億,輸出速度達100TPS(每秒輸出token數(shù))。據(jù)介紹,該模型專為Agent開發(fā)設計。
MiniMax技術文檔顯示,M2支持 20.48萬個token的上下文窗口。這一數(shù)據(jù)較其6月推出的上一代模型M1大幅縮減,而彼時“長文本理解”正是其宣傳的主要優(yōu)勢。M1為開源混合架構推理模型,總參數(shù)4560億,支持100萬token上下文輸入、8萬token的推理輸出,據(jù)稱為當時最大的上下文輸入輸出規(guī)模。



















京公網(wǎng)安備 11010502034662號 