1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

新闻 Omni-Infer v0.4.1 已经发布,超大规模 MoE 模型推理加速技术 下载

本帖由 漂亮的石头2025-09-27 发布。版面名称:软件资讯

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    487,979
    赞:
    47
    Omni-Infer v0.4.1 已经发布,超大规模 MoE 模型推理加速技术 此版本更新内容包括: v0.4.1 核心特性 稳定性压测与优化 支持模型列表 模型 硬件 精度类型 部署形态 DeepSeek-R1 A3 INT8 PD分离 DeepSeek-R1 A3 W4A8C16 PD分离 DeepSeek-R1 A3 BF16 PD分离 DeepSeek-R1 A2 INT8 PD分离 Qwen2.5-7B A3 INT8 混布(TP>=1 D...
    Omni-Infer v0.4.1 已经发布,超大规模 MoE 模型推理加速技术下载地址
     
正在加载...