4月24日消息,就在刚刚,官方终于宣布了DeepSeek-V4。
据DeepSeek微信公众号公布消息,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。
API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。
V4版本延续了DeepSeek效率优先的哲学,虽然总参数量高达1万亿,但每个token仅激活约370亿参数。这意味着其推理成本能与前代V3保持持平,这种极致的性价比设计一直是DeepSeek的核心竞争力。
据悉,DeepSeek V4将运行在华为最新的昇腾芯片上。
为了实现这一跨越,工程师们投入了大量精力解决芯片适配问题。他们不仅重写了核心代码,还完成了从英伟达CUDA生态向华为CANN架构的底层迁移。
这是一个重大的技术决策,更是一个极具冲击力的战略信号。DeepSeek此次并未给英伟达或AMD提供提前优化适配的机会,而是将早期访问权限独家开放给了国产芯片厂商。
文章来源:
买玉网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!



还木有评论哦,快来抢沙发吧~