专题:2025世界人工智能大会新浪科技
不过一位行业人士对此提出质疑,他表示,
这是一个480B参数激活35B参数的MoE模型,原生支持256Ktoken的上下文并可通过YaRN扩展到1Mtoken,拥有卓越的代码和Agent能力
Copyright © 2021 苟合取容网 All Rights Reserved