DeepSeek的话使国内技巧飞翔!他身后的EU8M0 FP8是什么?

DeepSeek的话使国内技巧飞翔!他身后的EU8M0 FP8是什么?

DeepSeek v3.1发起后,官方信息在整个AI圆圈中引起了轰动。这是一个新的下一代体系结构和芯片,其中包含大量信息,总计少于20个字。国家芯片公司的股票价格也随之而来。例如,今天的坎布里安人在日间谈判中增长了近14%,其总市场价值是从科学技术创新委员会的顶部跳跃。半导体的ETF在中午也增加了5.89%。 (我不知道该公司在发表信息的DePseek背后的神奇量化是否有机会宣传[手动狗头人的浪潮])这是什么EU8M0 FP8?下一个新一代国家意味着什么?庞大的人的大脑之后的问题。在Zhihu,许多伟大的老师也开始分析他们对这个话题的理解,并缩小科学。让我们从学习心态中的UE8M0 FP8的概念开始。什么是EU8M0FP8?可以通过将其在两部分中和之后进行两部分分配来解释“ EU8M0 FP8”的概念。以前,EU8M0是MXFP8路线的“比例因子”。 MXFP8是一种8位微型块格式,该格式在2023年由Open Compute Project推出的“ Specification V1.0的v1.0”中定义。OpenComputeProject是2011年启动的开源硬件协作项目。其成员行非常强大,包括Microsoft,Google,AMD,AMD,AMD,AMD,AMD,AMD,AMD,AMD,AMD和AMD,NVIAD和NVIAD,NVIC和更多。让我们谈谈MXFP8。它是在FP8中构建的。 FP8是一种编码方法,可压缩8位传统的浮点格式。 MXFP8的核心思想是首先在固定长度的“块”中减少张紧器,然后指定每个块的全部功能,例如“比例因子”,将所有数字划分为该因子的块togethers,然后将其写为fp8。这种区块级攀爬(而不是完整的张紧器水平)保证MXFP8保存8位e并扩展了可用的动态范围,您可以做很多次。资料来源:NVIDIA“量表因子”技术博客还包括8位,包括标志位,指数位和Mantissa位。开发人员可以自己分配这三个位置。符号位区分存在和不存在。如果有的话,它们会占据一点点,如果没有,则不会占据它。 EU8M0中的U表示无需签名(公司可以表示为您在没有书面的情况下省略的)。 E和M分别代表分配给指数位和位Mantissa的位数。 E8M0指的是分配给指数位的八位。其他常用格式包括E4M3,E5M2(这两个也常用于变焦电缆外部的身体部位)。所有都包含一些符号。其余的7位分配在指数函数和位mantissa之间。 DeepSeek的前开放源源明星Gemm FP8核已经接纳了UE8M0,但是这个projECT主要适应NVIDIA生态系统和CUDA生态系统。那么,使用此方法在指数中完全表达此方法的优点是什么?首先,EU8M0不包含灯镜和位符号,因此,如果处理器根据比例因子恢复数据,则必须将其乘以2的相应功率2。EU8M0的动态范围覆盖2^(-127)的动态范围2^(-127)至2^128,并可以轻松地为该部分提供一个分区的空间,以适用于一个分区的空间,以适用于一个分区的空间。此外,EU8M0还可以解决单个量表上FP8不能同时考虑大/较低值的问题。资料来源:NVIDIA技术博客EU8M0 explica为什么FP8具有其优势,并且更适合“下一个代代家用芯片”。大多数国家生产的质量加速器使用FP16/BF16 + INT8的计算途径,并完整的SPF(例如E4M3/E5M2NO)集成了8个乘法UNITS。但是,新的国家筹码首次由Moores的GPU Red Musa 3.1,Xinyuan VIP9000 NPU和另一个“ FP8”或另一个“ FP8”或“ FP8”块在促销材料中的2025 H2块,并共同验证了EU8M0格式与15种制造商,包括DeepSeek和Huawei。下一个代代的国内芯片已经为FP8做准备,但是HBM/LPPDDR带宽和上层芯片之间仍然存在很大的差距。使用EU8M0,一组32个FP8数据只能添加8位尺度读数。与传统的FP32量表4B(32位)相比,该空间储蓄量表被认为是Armitnext Estraenter Ecturas的优化方向。哪些国内芯片对DeepSeek进行了优化?在意识到什么是EU8M0 FP8之后,遇到感官的互联网用户开始再次推测。由于官员故意保密他的秘密,因此人们必须首先专注于批准“高速模型的改编”的前八个制造商。来源如此urce:在Wybo官方有关中国信息和通信技术的官方帐户中,所有人都很乐观,而市场反应非常直观。从今天的10:25开始,坎布里亚人在会议期间增长了近14%,总市场价值超过494亿元人民币,Smick超过了科学技术创新委员会的顶峰(实际情况遭受了最后情况)。原因也很简单。该公司的MLU370-S4,Siyuan 590和Latest 690系列芯片兼容。 FP8计算在体系结构设计和低精度计算机优化方面始终相对领先。出于同样的原因,Haiguang,Mu XI,Zhonghao Xinying甚至登录网络的中介机构也由Internet用户任命:Haiguang:Haiguang:他们的Deep Computing的DCU 3号DCU允许计算FP8,并具有更大的优化空间。 Mu Zhonghao Xinying:您的AI“ CYAN”芯片S提出FP8的准确性。红色高尔斯:作为本地FP8承认的少数国家GPU制造商之一,MTT S5000徽章承认FP8精度的计算。同时,一些可能“接近FP8”的制造商也出现在其库存列表中。例如,华为ASCE与Momento不兼容与本机FP8兼容,但是官方路线图确定它是“ 2025Q4 FP8本地”,因此每个人在2026年期望的910D(可能性)都可以成为So -so -called the Next -Next -Generation Chip’。除上述内容外,讨论中出现了许多芯片制造商的名称,这不是先例。猜测后没有最终结论,但不能阻止市场采取热烈的反应。根据最新消息,国内建议的概念比今天更高,科学技术的创新在过去三年半中增加了3%,​​共同促进了斯特伦然后是芯片行业的链条。那你为什么要参加狂欢节呢?如果这些国内芯片支持EU8M0 FP8,那意味着什么? Everything can be summarized in a prayer based on the current opinions of all parties both nationally and internationally.这意味着国内AI是指TOA软调整阶段,可以显着降低对Nvidia和AMD等外国计算机功率的依赖。这里的逻辑也非常简单明了。这是由于以前的UE8M0 FP8精度格式的优势(降低带宽,带宽,低能消耗,性能)的优势。换句话说,鉴于将来同样的硬件可以执行大型模型,因此国家芯片的“成本率相关比率”已大大增加。换句话说,这是一个有利的情况,因为这些国家芯片制造商在竞争中具有更大的优势。同时,DeepSeek对应于更改精度t并积极调整国家筹码的最佳性能点。该模型的柔软和调谐模型无疑是统一的。国内筹码到生态坐标系统。这就像当时的温特尔联盟一样。微软和英特尔正在通过深技术联合的力量在个人计算机领域中建立生态聚光灯,但现在它们被芯片和SEC的深层创造者所取代。另一件事是,主文本部分中提到的UE8M0 FP8提到的官员必须考虑到DEPSEEK-V3.1使用EU8M0 FP8量表的参数的精度。此外,该位置非常“隐藏”,并且在大多数功能更新之后被隐藏。如果官员没有在评论部分中添加句子,我认为没有人有任何感觉。您谈论这种行为,我不知道它是否是故意的。他有意,但总而言之,他非常微妙(手动狗头)。
特别声明:预期美国内容(包括照片和视频(如果有),包括照片和视频)已由NetEase Auto-Media平台的用户收费和发布。该平台仅提供信息存储服务。
注意:以前的内容(如果您有照片或视频)将由社交媒体平台NetEase Hao的用户收取和发布,仅提供信息存储服务。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注