云开体育张开剩余58%在语音相识方面-云开yun·体育全站app(kaiyun)(中国)官方网站 登录入口
发布日期:2026-01-21 22:09    点击次数:100

12 月 16 日音书,无问芯穹本日晓谕,开源无问芯穹端侧处理决策中的全模态相识小模子 Megrez-3B-Omni 和它的纯道话模子版块 Megrez-3B-Instruct。

官方默示,Megrez-3B-Omni 是一个为端而生的全模态相识模子,同期具备图片、音频、文本三种模态数据的处奢睿力:

在图像相识方面,Megrez-3B-Omni 是当今 OpenCompass、MME、MMMU、OCRBench 等多个主流测试集上精度最高的图像相识模子之一。

在文程序会方面,Megrez-3B-Omni 在 C-eval、MMLU / MMLU Pro、AlignBench 等多个泰斗测试集上得回端上模子最优精度。

张开剩余58%

在语音相识方面,Megrez-3B-Omni 复古汉文和英文的语音输入,还大略处理复杂的多轮对话场景,也能复古对输入图片或翰墨的语音发问,罢了不同模态间的开脱切换。

官方声称,与上一代过火他端侧大道话模子比拟,单模态版块的 Megrez-3B-Instruct 在推理速率上得回了显耀提高,最大推理速率不错跳跃同精度模子 300%。

附联系和解如下:

Github:https://github.com/infinigence/Infini-Megrez

HuggingFace:https://huggingface.co/Infinigence/Megrez-3B-Omni

Infini-AI 异构云:https://cloud.infini-ai.com/genstudio/model/mo-c73owqiotql7lozr

Modelers:https://modelers.cn/models/INFINIGENCE-AI/Megrez-3B-Omni

ModelScope:https://www.modelscope.cn/models/InfiniAI/Megrez-3B-Omni云开体育

发布于:北京市