金十数据2月26日讯,第四范式(06682.HK)今日推出大模型推理一体机解决方案SageOneIA,进一步减低了大模型推理成本。如满血版的DeepSeekV3/R1仅需要两台一体机即可使用。此外,一体机解决方案还集成了智能算力池化技术,在支持DeepSeekV3/R1、QWen2.5、LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换,GPU利用率提升30%以上,推理性能平均提升5-10倍。
第四范式推出大模型推理一体机解决方案SageOne IA
金十数据2月26日讯,第四范式(06682.HK)今日推出大模型推理一体机解决方案SageOneIA,进一步减低了大模型推理成本。如满血版的DeepSeekV3/R1仅需要两台一体机即可使用。此外,一体机解决方案还集成了智能算力池化技术,在支持DeepSeekV3/R1、QWen2.5、LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换,GPU利用率提升30%以上,推理性能平均提升5-10倍。