登录或注册

XenForo 1.5.14 中文版——支持中文搜索！现已发布！查看详情
Xenforo 爱好者讨论群：215909318 XenForo专区

XenForo 1.5.14 中文版 Xenforo 爱好者

新闻 Omni-Infer v0.5.0 发布，超大规模 MoE 模型推理加速技术下载

本帖由漂亮的石头于 2025-09-27 发布。版面名称：软件资讯

漂亮的石头版主 管理成员

注册:

2012-02-10

帖子:

488,438

赞:

48

Omni-Infer v0.5.0 已经发布，超大规模 MoE 模型推理加速技术。 v0.5.0 核心特性支持VeRL 其它优化基于5P8-1D32@A3，2K+2K，Deepseek R1性能达到QPM500，TTFT<2s，TPOT<50ms 基于1P16-1D32@A2，2K+2K，Deepseek R1单卡Decode峰值性能达到400 TPS，TPOT<50ms 支持模型列表模型硬件精度类型部署形态 DeepSeek-R1 A3...
Omni-Infer v0.5.0 发布，超大规模 MoE 模型推理加速技术下载地址

漂亮的石头, 2025-09-27

#1

(您必须注册并登陆后发表回复。)

正在加载...

论坛
论坛

快捷链接
- 最新主题
媒体相册
媒体相册

快捷链接
- 最新媒体
下载中心
下载中心

快捷链接
- 活跃作者
- 最新评论
会员
会员

快捷链接
菜单