产品及服务
AI原生赋能平台
智算基础设施
AI算力调度与加速平台
KU酷游DeepSeek版
DC·AI生态创新中心
行业解决方案
汽车
金融
医疗医药
合作伙伴
产品技术伙伴
联盟合作伙伴
KU酷游·(中国区)官方网站
关于KU酷游
关于我们
企业文化
ESG
联系我们
酷游-KU游平台登录
当地时间11月5日◈★ღ,熟悉韩国存储巨头SK海力士的人士确认◈★ღ,该公司明年向英伟达供应的HBM4单价约为560美元(约合人民币3991元)◈★ღ,比目前供应的HBM3E(约合370美元)价格高出50%以上ku酷游官网入口◈★ღ。◈★ღ。
华为刚开源的技术或许能成为其中一个解决之道◈★ღ。11月5日◈★ღ,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源◈★ღ。
这种技术的关键之处在于◈★ღ,可以根据记忆热度◈★ღ,在不同存储介质中分级缓存数据◈★ღ。比如在HBM中存储“实时记忆数据”◈★ღ,在DRAM中存储“短期记忆数据”◈★ღ,在SSD中存储“长期记忆数据与外部知识”◈★ღ。
这么做的好处是◈★ღ,可以分级管理推理过程中产生的KV Cache记忆数据(优化计算效率◈★ღ、减少重复运算)kuyou.com◈★ღ,◈★ღ,充分利用不同存储介质的特性◈★ღ,提高HBM的利用率◈★ღ,还能平衡成本◈★ღ。
华为透露◈★ღ,UCM架构包含了多个协同工作的关键功能模块秋山惠秋山惠◈★ღ,比如UCM稀疏化模块(UcmSparseBase)◈★ღ、稀疏化KV管理器(SparseKVManager)酷游官方网站◈★ღ、KV Cache存储组件 (UcmKVStoreBase)和UCM连接器(UC Connector)等◈★ღ。基于该架构◈★ღ,UCM目前具备四大关键能力◈★ღ:稀疏注意力◈★ღ、前缀缓存秋山惠◈★ღ、预填充卸载和异构PD解耦秋山惠酷游app下载官网网站版◈★ღ!◈★ღ,可实现首Token时延最高降低90%◈★ღ,系统吞吐最大提升22倍酷游官方网站◈★ღ,并达到10倍级上下文窗口扩展KU游酷游◈★ღ。
“AI SSD聚焦提升训练效率和推理体验, 存储器领域不会仅有HBM一枝独秀◈★ღ,有望形成百花齐放的竞争态势酷游官方网站◈★ღ。华为计划与一体机厂商合作◈★ღ,改变现有局面酷游官方网站◈★ღ,为AI存储器市场注入新活力◈★ღ,带来更多可能性◈★ღ。”有知情人士对观察者网说道◈★ღ。
当下◈★ღ,国外厂商在HBM领域仍然拥有技术和价格的主导权◈★ღ。Counterpoint Research的报告显示◈★ღ,SK海力士在二季度的全球HBM市场上以62%的出货量占据首位◈★ღ,美光科技(21%)和三星电子(17%)紧随其后◈★ღ。按照SK海力士的产品计划表◈★ღ,HBM4已于9月完成开发并投入量产◈★ღ,将于今年第四季度开始出货◈★ღ,并计划于明年全面扩大销售◈★ღ。
HBM4是HBM第六代产品◈★ღ,其2048位接口和最高16层的堆叠将带来带宽和容量的巨大提升◈★ღ,带宽目标超过2 TB/s◈★ღ,容量可达64GB酷游官方网站◈★ღ。业界特别是三星和SK海力士正在探索将HBM堆栈更直接地连接到处理器(如GPU)芯片上◈★ღ,甚至研究在中间层使用光子技术以追求极致的传输速度和能效◈★ღ。这种深度融合可能会模糊逻辑芯片和存储芯片之间的界限◈★ღ,让两者更紧密地集成在一起◈★ღ。
在出口管制和技术追赶下◈★ღ,中国企业难以获得充足的高端HBM◈★ღ。而UCM作为一种记忆数据分级管理技术◈★ღ,开源的关键意义◈★ღ,在于能让更多开发者和企业通过记忆数据分级管理◈★ღ,降低对高端HBM的依赖◈★ღ。但它不是为了取代◈★ღ,也无法取代HBM秋山惠◈★ღ,而更像是华为的另一种“系统补短板”◈★ღ,把HBM的优势发挥在更合适的地方◈★ღ,实现降本增效◈★ღ。