金十數據2月26日訊,第四範式(06682.HK)今日推出大模型推理一體機解決方案SageOneIA,進一步減低了大模型推理成本。如滿血版的DeepSeekV3/R1僅需要兩臺一體機即可使用。此外,一體機解決方案還集成了智能算力池化技術,在支持DeepSeekV3/R1、QWen2.5、LLama3.3等主流大模型的基礎上,企業可靈活在滿血版和多個蒸餾模型之間切換,GPU利用率提升30%以上,推理性能平均提升5-10倍。
第四範式推出大模型推理一體機解決方案SageOne IA
金十數據2月26日訊,第四範式(06682.HK)今日推出大模型推理一體機解決方案SageOneIA,進一步減低了大模型推理成本。如滿血版的DeepSeekV3/R1僅需要兩臺一體機即可使用。此外,一體機解決方案還集成了智能算力池化技術,在支持DeepSeekV3/R1、QWen2.5、LLama3.3等主流大模型的基礎上,企業可靈活在滿血版和多個蒸餾模型之間切換,GPU利用率提升30%以上,推理性能平均提升5-10倍。