DeepSeek-V4发布,华为云首发适配
4月24日,DeepSeek-V4模型正式发布并开源,华为云首发适配。DeepSeek-V4 拥有百万Token超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。其中,DeepSeek-V4-Flash模型参数下降至284B,推理成本进一步降低,模型参数和激活更小,V4-Flash 能够提供更加快捷、经济的 API 服务,实现百万上下文普惠。当前,华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4 -Flash API的Tokens服务。 在此次新模型适配过程中,华为云在系统层、算子层和集群层的关键能力上协同,分别从调度效率、计算效率和数据流转效率三个维度保障新模型快速适配与高性能落地。 针对DeepSeek-V4,华为云首发适配模型分层注意力压缩机制,实现V4注意力机制下 KVCache的高效分配管理,提供TopK、SWA、CFA等10+昇腾高性能融合算子,搭配框架异步调度、MTP多步投机等框架优化,支持原生1M长上下文的高性能推理。
华为云以高效的AI基础设施为核心打造“硅基黑土地”,开放接纳自研和第三方主流大模型和众多智能体,为企业解难题,提升生产效率。 据悉,金山办公、360等企业已通过华为云接入DeepSeek新模型,此外,DeepSeek-V4-Pro版本也将于近日上线。
版权所有,未经授权不得以任何形式转载及使用,违者必究。
Related Articles
3个月手搓Gamma架构,这个团队打造出了场景白盒化推理的“下一代内容OS”
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 2026-04-28 ...
腾讯智慧出行:单纯大模型上车无意义,要落地场景智能体
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 腾讯智慧出行:单纯大模型上车无意义,要落地场景智能体 ...
Google is testing AI chatbot search for YouTube
Google is trying out an AI Mode-like search experience for YouTube. The company is now testing “a new way to search on YouTube that feels more like a conversation,” with results pulling in things like...
Canonical lays out a plan for AI in Ubuntu Linux
Skip to main contentCanonical plans to add AI features “throughout 2026” but says “Ubuntu is not becoming an AI product.”Canonical plans to add AI features “throughout 2026” but says “Ubuntu is not becoming...