苹苹果香港id和美国id果id账号美国-Shadowrocket(小火箭)

全球卫星导航系统（GNSS）是能为地球表面或近地空间任何地点提供全天候定位、导航、授时的空基无线电导航定位系统。美国的全球定位系统（GPS）、俄罗斯的格洛纳斯卫星导航系统（GLONASS）、欧盟的伽利略卫星导航系统（Galileo）以及我国的北斗卫星导航系统（BDS）是全球四大卫星导航定位系统。受多路径效应、对流层折射等因素影响，普通 GNSS 单点定位精度一般在 5-10 米（实际普通 GNSS 在开阔地带单频单模单点定位精度约为 2.5 米）。为提高卫星导航系统的定位精度，出现了高精度卫星定位技术，主要包括以基于网络 RTK 技术的连续运行参考站系统（CORS）为代表的地基增强技术、以美国广域增强系统（WAAS）为代表的区域星基增强系统以及基于实时精密单点定位技术（PPP）的商业全球星站差分增强技术。

惯性导航系统（INS）属于推算导航方式，即从一已知点的位置根据连续测得的运动体航向角和速度推算出其下一点的位置，因而可连续测出运动体的当前位置。惯性导航系统的核心部件为陀螺仪和加速度计，利用载体先前的位置、惯性传感器测量的加速度和角速度来确定其当前位置。给定初始条件，加速度经过一次积分得到速度，经过二次积分得到位移。角速度经过处理可以得出车辆的俯仰、偏航、滚转等姿态信息，利用姿态信息可以把导航参数从载体坐标系变换到当地水平坐标系中。

惯性导航系统有自主导航、不受外部依赖、输出频率高（大于 100Hz）等优点。定位精度取决于陀螺仪、加速度计等惯性传感器的测量精度，高性能 IMU 价格昂贵。惯性导航定位误差会随着时间不断累积，导致位置和姿态的测量结果偏离实际位置，因此无法用来做长时间的高精度定位。因此，通常采用惯性导航系统作为 GNSS 信号丢失时的补偿，以使导航系统功能连续。

惯性导航起源于军工领域，因其成本高，长期用于国防和商用航空航天领域，相关模组器件主要由我国军工企业研发制造，产品以高精度战术级器件为主（包括激光惯性导航、光纤惯性导航和高精度 MEMS 惯性导航）。但是，战术级惯性导航模组器件一般价格昂贵，且与民用车辆所需的技术路线不同。MEMS 惯性导航具有价格低、功耗低、体积小、可靠性高和环境适应能力强等特点，推动了惯性导航在民用领域的发展。

汽车电子电气架构正逐步由分布式 ECU 向域控制器、中央集中架构方向发展。高精度定位模块在汽车中的搭载方案主要为以下两种：①高精度卫星定位模块挂接到中央网关。高精度定位模块包括卫星定位信号接入、RTK 信息接入、IMU、融合定位算法、高精度地图单元等。该方案需要将高精度定位及高精度地图信息通过车内网络传输到自动驾驶域控制器，加大了时间延迟，降低了高精度定位的精度。

②高精度卫星定位模块集成到自动驾驶域控制器，自动驾驶域控制器直接接入卫星定位信号、GNSS 卫星增强信息，并配置惯性测量单元 IMU、高精度地图单元和融合定位算法等。该方案可以减少数据传输，有效降低信息的延迟，提升高精度定位的精度。

目前卫惯组合导航产品的主流方案是外置的 P-box 方案，或为中间形态，目前已有车企开始把组合导航盒子拆开，将 GNSS 模块、IMU 模块融入到域控制器中。高精度组合导航属于传感器，其最终形态或为芯片化、小型化的模组，和域控制器相融合，更好地共享算力、感知数据。同时，这种集成方案将减少线束的使用。整机形态的组合导航需要电源、信号等多种线束接入使用。线束用量的大幅减少，不但减少整车重量，还大幅降低了自动化生产中人工的参与和后期维护难度。

自动驾驶需要绝对定位和相对定位。相对定位输出的是区域内的相对位置信息，常用基于激光雷达、毫米波雷达、摄像头等传感器的特征匹配定位技术。绝对定位输出的定位信息是基于统一的定位坐标体系下的位置，目前绝对定位方案都是基于卫星的定位手段。高精度卫星定位相较于视觉、雷达等高精度相对定位传感器，不受天气、光线等影响，可在全场景下帮助汽车实现精准定位。在众多高精度定位方案中，只有 GNSS 卫星定位为车辆提供绝对的定位信息，其余传感器均提供相对定位。精确的高精度初始绝对位置是最基本的参数，无论用哪种高精度定位解决方案，GNSS 卫星导航定位是必不可少的，能够平行于相对定位技术给系统提供非常高的可靠性补充，从而满足系统的功能安全要求。

组合导航系统主要为自动驾驶车辆提供三类信息：第一类为坐标信息，如经纬度、高程，可以区分高架上下、隧道和地库；第二类为姿态信息，包括侧倾、俯仰等；第三类是动力学信息，包括加速度、速度、角速度。

高精度定位和高精度地图密切关联，二者相辅相成。高精度定位得到车辆在高精度地图中的精确位置和姿态，高精度地图可有效弥补传感器的性能边界，提供实时全方位周围驾驶环境、交通状况信息等重要的先验信息，并帮助车辆提前重新规划路径。相对定位很难与标准的高精度地图配合使用，两者的坐标系、数据格式、接口、时间轴不同，标准的高精度地图需要与绝对定位搭配使用。

卫惯组合导航应用场景包括自动驾驶农机、矿场无人驾驶、无人清扫车、乘用车等。无人矿卡普遍采用高精度 GNSS/IMU 组合导航、激光雷达、摄像头、毫米波雷达等传感器，再结合高精度地图进行融合定位，使无人矿卡的感知系统可以在矿场恶劣的环境下实现全天候全天时高精度的定位精度。

哪吒、小鹏、蔚来、理想等新势力车厂均规划搭载高精度定位。小鹏汽车 P5 搭载 13 个高清摄像头、5 个毫米波雷达、12 个超声波雷达、2 个车规级激光雷达共 32 个传感器及 1 组高精度定位单元（GNSS+IMU）。理想 L9 配备高精度组合导航定位系统，助力其实现全场景的导航辅助驾驶功能 NOA。Aquila 蔚来超感系统拥有 33 个高性能感知硬件，包括 2 个高精度定位单元。

国内 L2+应用组合导航产品是从 2017 年上汽荣威 MAR WELL XPro 1000 辆 demo的项目开始，近期各主机厂相继推出了数十款搭载高精度定位技术的车型。据佐思数据库统计，2021 年中国 L2 级自动驾驶乘用车的装配率已突破 20%，部分L2级车型通过搭载高精定位和高精地图实现了高速领航自动驾驶。如小鹏P7，蔚来 EC6、ES6、ES8，广汽埃安 V、埃安 LX，长城 WEY 摩卡等车型可以选装高精定位模块，一汽红旗 E-HS9、高合 HiPhi X苹果香港id和美国id、2021 款理想 ONE 等车型标配高精定位模块。

L3 级自动驾驶合法上路呼之欲出。2022 年 6 月 23 日，《深圳经济特区智能网联汽车管理条例》获深圳市表决通过，这意味着无人驾驶汽车可以在深圳合法上路。该条例是全国首个对 L3 及以上自动驾驶权责、定义等重要议题进行详细划分的官方管理文件，为其他城市 L3 级自动驾驶准入政策提供了样板。

假设 2023 年中国 L3 级别自动驾驶的渗透率约为 6.4%，2025 年 L3 级别自动驾驶渗透率增长至 25%，L4/5 级别自动驾驶渗透率为 3%。2021 年高精度卫惯组合导航定位设备单价约为 2000 元，此后单价逐年小幅下降，2025 年或降至 750 元。假设 2021-2030 年我国汽车销量稳步提升，由于高精度定位是 L3 级别及以上自动驾驶标配，2022 年我国高精度卫惯组合导航设备市场空间为 7.3 亿元，预计 2025 年市场空间将增至 53.2 亿元，2022-2025 年 CAGR 为 94%。

2018 年，通用汽车使用 Trimble RTX 技术作为高精度 GNSS/GPS 差分数据源，为配备通用汽车超级巡航 Super Cruise 高速公路脱手驾驶系统的车辆提供绝对定位位置。2021 年 3 月，本田正式发售 L3 级自动驾驶量产车—本田 Legend EX（获得日本国土交通省 L3 级自动驾驶认证），配备了 Honda SENSING Elite 智能驾驶系统，搭载高精度定位模块，与传感器、3D 高精度地图配合使用。2021 年 12 月，德国联邦汽车运输管理局认为奔驰的 L3 级自动驾驶系统符合规定，批准上路。根据奔驰的规划，旗下 S 级和 EQS 两款旗舰轿车将率先配备 L3 级自动驾驶系统（搭载高精定位模块+高精度地图）。

特斯拉的纯视觉方案是通过神经网络对各类场景进行自动标注和训练，但不同国家、不同地域的情况下，总有未经训练的、没有覆盖到的场景类型，像形状不规则的工程车，很可能是视觉算法中缺失的识别对象。从 2021 年 7 月 20 日到 2022 年 5 月 21 日，美国高速公路安全管理局（NHTSA）共收到 367 起涉及 ADAS 辅助驾驶系统的事故报告，其中特斯拉上报了 273 起，占比高达 74.4%，可见纯视觉自动驾驶方案感知冗余度不够，现有感知模型对 Corner case（长尾问题）泛化性不足，很难达到 L3 及以上自动驾驶的要求。

当视觉定位因环境问题失效，特斯拉或需要搭载卫惯组合导航或其他传感器，实现更高级别的自动驾驶。随着卫惯组合导航的逐步成熟，价格或逐步下降，性价比优势明显。2022 年 6 月，特斯拉向美国联邦通信委员会注册了一款全新高分辨率雷达设备，此举将允许特斯拉销售搭载新雷达装置的汽车。我国新势力车厂具备先进的电子电气架构，通过多传感器融合达到高级别自动驾驶。海外车厂多为传统燃油车品牌，电子电气架构的迭代较慢，影响高精度定位上车进程。L3 及以上自动驾驶对高精度定位的需求凸显，全球车企或加快高精度定位的研发。我国供应商具备较强的技术储备，丰富的量产经验或有助于全球市场的开拓。

组合导航终端的元器件主要为 GNSS 模块、INS 模块和数据处理模块。GNSS 模块分为射频前端、信号捕获、信号跟踪和 RTK 解算，负责卫星信号定位。INS 模块包括 IMU 和解算单元，分别负责测量三轴加速度和三轴角速度数据以及 IMU 输入数据及数据处理模块反馈的误差数据。数据处理模块负责进行数据融合，常用卡尔曼滤波算法。卡尔曼滤波是一种估算方法，它以系统的位置坐标、速度、加速度、航向以及加速度误差、角速度误差和角度误差为系统状态，并以系统初始状态作为模型的初始条件。在每次测量更新时，都要利用当时的状态估算值和存储的位置数据计算出预测值。然后将 GNSS 数据与预测值比较，其差值经过卡尔曼滤波处理，产生定位系统误差状态参数的估算值，并将这些误差估算值反馈给定位系统进行修正，从而提供修正后更准确的定位数据。卫导定位、惯导定位输出的融合方式可分为松耦合、紧耦合和深耦合。其中，松耦合是最简单的组合模式，GNSS 与 INS 各自独立工作，并利用两者位置、速度信息进行数据融合；紧耦合比松耦合复杂；深耦合在结构和算法方面更加复杂，是 GNSS 与 INS 最深层次的组合方式。

在松耦合结构中，GNSS 和惯导独立工作，GNSS 输出定位结果，惯导输出惯性数据，两者得到的姿态、位置等数据之差作为量测输出，通过卡尔曼滤波器得到惯性元器件误差和导航参数误差，然后进行反馈校正。这种简单组合方式对厂商算法要求较低、易于集成。在高速公路、地下车库等卫星信号强或完全无卫星信号的场景下与紧耦合、深耦合相当；但在有卫星信号但是信号被遮挡的场景下，GNSS 不能够有效地进行定位和测速，从而造成 INS 在航位推算时精度衰减很快，定位效果不如紧耦合、深耦合。

紧耦合可以有效利用信号遮挡环境下的卫星观测数据，提升定位效果。在进行紧耦合时，利用 GNSS 接收机观测的原始信息与 INS 输出数据进行组合，得到伪距与伪距率，将其和 GNSS 观测得到的伪距与伪距率的差值作为滤波器的观测值。紧耦合在原始 GNSS 观测端进行信息融合，因此在 GNSS 卫星可观测数据少于 4 颗时仍然能够输出有用信息，而遇到同样情况时松耦合的 GNSS 输出信息不可用。因此在相同硬件配置下，紧耦合的鲁棒性会更高。紧耦合的难点在于组合导航终端厂商需要具备 RTK 定位算法，在卫导领域积累较浅的厂家很难实现。

深耦合除了可以完成松耦合或紧耦合的处理工作外，还利用 INS 的测量（加速度）或者导航信息（位置、速度）对接收机的信号跟踪进行辅助。深耦合需要深入到接收机内部，涉及接收机的信号处理层次的融合，在结构或算法方面都比松、紧耦合更加复杂，是 GNSS 与 INS 最深层次的组合方式。深耦合将惯导模块的部分数据送入 GNSS 基带芯片里，将惯导的惯性数据作为 GNSS 解算的一部分，所以对组合终端厂商的基带芯片自研能力要求较高。具体来看，GNSS 导航芯片经过基带处理，计算得到伪距和多普勒等值，同时 MEMS 器件组成的 INS 系统解算出当前的 INS 位置、速度、姿态信息，将二者输出信息一起放入卡尔曼滤波器中进行信息融合和 PVT 解算。INS 和 GNSS 之间是双向信息传输，一方面 GNSS 信号用于修正 INS；另一方面，INS 信号在卫星星历的辅助下，也用于计算载体相对于 GNSS 卫星的伪距和伪距率，并用该信息辅助 GNSS 信号的接收和锁相过程，以提高 GNSS 的接收精度和动态性能。

全开阔场景下，定位精度由 GNSS 性能决定；全遮挡场景下，定位精度由 IMU 性能决定，上述两种场景的定位精度与耦合方式关系较弱。三种耦合的区别主要体现在有部分遮挡的环境（比如高楼林立的城市、港口等场景下），基于更前端融合的耦合方式可以实现更精准的定位。目前搭载组合导航终端的乘用车仅实现了接近 L3 级别的自动驾驶，自动驾驶的应用场景较简单。在 L3 级别及以上的自动驾驶，需要满足更多场景，包括高楼旁、隧道、高架桥等，对耦合的要求更高。

高精度卫星导航定位算法会直接影响定位精度，是行业中最重要的门槛性技术。公司自 2003 年成立以来，始终聚焦高精度导航定位应用相关的核心技术及产品，涵盖从广域到区域的增强技术、从厘米级到毫米级的定位技术、从封闭场景到半封闭场景导航与控制技术。通过对核心算法的持续攻关，华测导航不断提升技术先进性，以持续提升定位精度、控制的准确度等产品关键性能。公司围绕 GNSS 高精度算法核心技术，布局 GNSS 芯片、OEM 板卡、微波天线等核心基础部件研发；攻坚静态、动态、网络实时处理算法软件，拥有高精度 RTK、PPP、静态解算、网络 RTK、精密定轨技术、组合导航定位技术等完整的算法研究能力；集成网络数据链、基带信号处理、组合导航算法等先进技术，延伸研究点云数据采集及处理、机械控制系统等技术，推动面向新兴应用领域的技术产品和解决方案的研发。

GNSS 基带算法是影响定位精度的核心因素之一。凭借领先的基带算法和组合导航定位算法积累，华测能够基于普通较低成本惯性器件，依靠自研核心算法对低成本惯性器件输出的原始数据进行标校和补偿，使最终输出的惯导数据的精度与高成本惯导器件相似，从而极大节省成本，提升产品毛利率。

组合导航系统是实现无人车、无人船、无人机、移动机器人等自主导航的重要手段。华测导航产品可在隧道、高架、林荫道、高楼边、峡谷等复杂环境下提供高精度定位与姿态信息，满足飞机、高铁、汽车等高速运动载体和扫地机器人、巡检机器人等低速无人驾驶机器人等的使用。依靠公司十余年采集的数万个典型用户场景的实测数据来不断打磨算法的适用性和先进性，确保定位结果的准确性。公司拥有由高精度组合导航系统、高精度天线、卫星导航增强服务系统等组成的自动驾驶高精度导航方案，高精度导航方案在商用车自动驾驶领域已经开始小批量使用。公司凭借组合导航方案，与部分矿车企业合作矿车自动驾驶项目，与部分无人港口企业合作了港口无人驾驶项目。

凭借积累的核心算法及芯片研发优势，华测乘用车组合导航终端爆发在即。在乘用车领域，公司已经被指定为哪吒、吉利路特斯、比亚迪、长城等多家车厂自动驾驶位置单元业务定点供应商，持续跟进理想汽车、广汽、威马、上汽等乘用车厂商产品调试、测试等，预计 2022 年下半年再新增数家车厂定点，实现组合导航终端的大批量出货，2023 年出货量同比大幅增长。稀缺的量产经验也有助于公司突破国内外车厂、获取高份额。

公司积极布局车规级 GNSS SOC 芯片、高精度车规级 IMU 芯片，有望在紧耦合、深耦合中占据更大优势。2020 年，公司拥有完全自主知识产权的高精度定位定向基带芯片“璇玑”实现成功投产，提升了公司产品设计和开发的灵活性，能够在产品价格、功能实现等方面，进一步满足不同行业应用的差异化需求。目前公司自研的璇玑芯片以自用为主，主要与公司终端产品配套提供给下游客户使用。在当前基带芯片产业化的基础上，公司继续攻关下一代 GNSS 芯片、OEM 板卡、模组、天线等基础器件领域，研制更高集成度和更高制程的芯片，作业场景从测绘为主，进一步向车辆导航、无人机、智能机器人等拓展。

广州导远电子科技有限公司是为智能驾驶提供高精度定位技术的科技公司，致力于引领智能驾驶定位技术的变革，与国内的近百家主流的自动驾驶、智能驾驶厂商建立深度合作关系，已经为包括新造车势力、传统车企在内的行业领先的汽车品牌大批量交付高精度定位技术及产品。2018 年，导远开始在乘用车上量产高精度组合定位技术。公司目前总部位于深圳，在广州开发区、江苏海门设有制造和研发中心，在苏州工业园区设有研发中心，并在北京设有分公司。公司完成了 A 轮和 Pre-A 轮、B 轮、C 轮融资，投资人包括国投招商（国家财政部参与基金出资）、红杉资本、经纬创投、高瓴创投、越秀产投、广州开发区投资集团等知名机构。

2021 年 4 月，导远电子正式推出第一代高精度地图盒子。该产品通过融合 IMU、 RTK、车速、ADAS 相机、高精地图数据等，可实现车道级定位，并提供 2km 预见性巡航能力，为高级辅助驾驶系统提供决策依据，助力 L2+智能驾驶功能的研发。通过新加入的高精地图与高精度定位的匹配，智能驾驶汽车可获得超普通车载传感器探测距离的感知能力，拓展多种复杂功能场景 ODD。

公司拥有高精度组合定位系统的 ISO 26262 ASIL-D 功能安全认证，客户包括国内多家行业领先的知名主机厂，如上汽集团、小鹏、上汽大通（商务车、京东仓库智能车）等，获得超过 60 个车型定点。目前（截止 2022 Q1），公司的高精度组合定位系统已搭载于超过 20 万辆 L2 及以上前装量产车，累计安全行驶里程已超过 2000 万公里。

中海达主要为新能源汽车和特种车辆（包括港口集卡、高速牵引车、工地工程车、低速环卫车、无人物流配送等）的自动驾驶和辅助驾驶提供车载高精度定位方面的产品解决方案和技术支持与服务。公司设立中海达（北京）导航定位技术研究中心，专职从事智能驾驶车载高精度定位算法等相关领域的研发；建设完成全新车规生产基地，新车规生产基地满足无尘化、自动化的高标准要求，并达到 IATF16949 质量体系及 ISO26262 功能安全系统的标准。2021 年，中海达车载高精度定位天线出货量已突破十万套，完成从小批量出货到规模化出货的转变。公司已完成多款智能汽车车载高精度产品的量产和定点化测试工作，并与国内多家主流主机厂和大型 TIER 1 建立深度合作关系，部分车载定位产品已进入送样测试阶段。

湖南北云科技有限公司于 2013 年成立于湖南长沙，为智能汽车、自动驾驶、驾考驾培、机器人、精准农业、工程机械、轨道交通等领域提供高精度定位与导航。公司专注于研发高精度卫星导航核心部件，从自研的 Alita 基带芯片、Ripley 射频芯片迭代到组合导航模块 M1 采用的 RTK SOC 芯片 Elsa，集成度和算法性能不断提升，在制造成本上也成倍降低。高精度组合导航接收机 X2 于 2021 年发布，X2 以深耦合方式结合 GNSS 和 INS 系统，主要针对城市中车载应用场景。针对 N-RTK 服务覆盖不佳的区域以及海外用户，增加了 L 波段信号接收以及 PPP/PPP-RTK 功能，以及 RTK/PPP 模式的无缝切换，在没有移动信号的环境下，仍然能够通过星基增强信号提供高精度定位。

可应用于自动驾驶的 M1 组合导航模块采用了贴片式封装，做到了 30mm*40mm 的小尺寸。M1 基于北云科技自研的 RTK SOC 芯片开发，集成了基带、射频等功能。采用深耦合组合导航算法，可以降低对 IMU 等级的要求，实现优秀的成本控制。在定位精度上，M1 经过 RTK 解算的水平定位精度能够达到 0.8cm+1ppm（定位精度为 8mm，离基站距离每公里带来的偏差不超过 1mm）。在隧道苹苹果香港id和美国id果id账号美国、地下停车场等GNSS信号完全中断的场景中，M1的组合定位精度可以达到行驶里程的0.1% （RMS）。

上海戴世智能科技有限公司于 2015 年 1 月 20 日成立，核心团队有汽车行业背景。公司惯导产品算法融合了车辆动力学方程，产品已经应用在无人机系统、汽车自动驾驶测试领域。2021 年 10 月 12 日，智能驾驶高精度定位系统供应商“戴世智能”完成 Pre-A 轮融资，由奥笙资本投资，融资将用于新产品及工艺开发，提升交付能力等。戴世智能于 2018 年推出针对 L4 级自动驾驶用组合惯导国产替代方案，覆盖 RoboTaxi、RoboBus 等应用场景，2020 年落地智能制造工厂，2021 年完成新一代 IMU 制造工艺的升级及关键工艺国产化，2022Q2 工厂或可实现 50 万套年产能。目前公司产品已经被上汽、广汽、长安等车企进行测试匹配。

自2010年起，《麻省理工科技评论》每年都会依据“高精尖科技创新”和“成功的商业模式”两个核心指标遴选出“50家聪明公司”，旨在寻找对世界具有预见性并引领科技浪潮的创新公司。从创新的角度，一家伟大的公司应具有改变世界的能力。在英伟达的官方介绍中，就用简短的几句话总结了在这方面的独到之处：“英伟达率先采用加速计算应对原本无法解决的挑战。在 AI 和计算机图形领域，我们的研究成果正在改变总价值达 100 万亿美元的各行各业（包括游戏、医疗健康和交通运输），并对社会产生了深远的影响。”

英伟达也理所应当多次上榜《麻省理工科技评论》“50家聪明公司”榜单。这家成立于1993年的GPU公司在技术层面到底有什么特别之处？

CUDA到底有什么优于其他软件的特殊之处？它是如何帮助英伟达打通产品上下游的呢?我们将和中信证券的首席科技产业分析师许英博，以及GGV纪源资本的投资副总裁陈于思一起从英伟达聊起，深入浅出地分析国产GPU的挑战与前景。

本期我们要聊一个非常有意义的话题——全宇宙知名的公司英伟达。因为这个话题非常热，所以我请到了两位超级重磅嘉宾，一位是来自中信证券的首席科技产业分析师许英博，另一位就是我们非常熟悉的GGV纪源资本的投资副总裁陈于思。

大家好，我是中信证券的科技分析员许英博。有别于比较典型的证券分析师，在相对短的时间内，对一个行业做纵深切入研究，我的研究更多是一种更大范围内偏横向的比较研究，以及在更长历史维度上的研究。简而言之就是，在更大空间和更长时间内去做科技产业的比较研究。

大家好，我是GGV纪源资本的陈于思。我目前主要在看人工智能、元宇宙还有芯片半导体方向的投资。我原来也是学芯片出身，在斯坦福获得了电子工程的博士学位。今天要聊英伟达，我有非常多的同学、朋友包括老师，有在英伟达工作的经验。所以我今天非常高兴和大家一起讨论这个话题。

如果让我从投资行业来讲，过去一年最火爆的，无非就是元宇宙和AI。今天我们聊的话题GPU其实就是元宇宙和AI背后的算力大脑。我想请问一下英博，您怎么看GPU这个领域呢？

目前GPU领域关注度非常高，其实源于它是交叉赛道里并行计算的一个基础。这种交叉赛道，一方面来自于比如说人工智能的训练端和推理端，一方面来自于大规模的科学计算和仿真需求，同样也有对于未来元宇宙的猜测和判断。

在不同的科技浪潮的迭代情况下，我们发现大量的运算变成了其中重要的需求。为了支撑这种大量的计算。GPU的通用性并行计算的需求的优势就逐步显现出来，GPU自然也就得到了市场更多关注，包括英伟达的大幅持续上涨，也带来了市场对该领域更多的关注。

您刚才提到一个词叫“通用计算”，为什么GPU可以做“通用计算”，这是怎么实现的呢？

其实我们看到GPU最早是用来做图形渲染，做一些跟3D图形处理相关的事情。英伟达也算是最开始发现GPU还可以去做更多人工智能相关计算或者所谓“通用计算”，那么他们通过持续快速的迭代，进入到通用计算领域。从整个基础上来讲，GPU里面大量并行的ALU的计算单元，使它的并行计算成为可能。

于思，你作为芯片方向的专家，要不要给我们科普一下，赛道里GPU（图形处理器）和GPGPU（通用图形处理器）这两个概念有什么不同？这两类公司有什么不同？

首先我觉得不管是GPU还是GPGPU，都属于这种超大算力的大算力芯片，在国际上来说，其实是一个格局更加明确的市场，主要只有英伟达、AMD两个玩家。

如果单是从市占率来说，英伟达远超AMD。国内市场由于政策扶持，也是有一个结构性的机会，让国内有非常多创业公司。

所谓GPU和GPGPU，大家可以这么理解：其实GPU是 GPGPU加上图形渲染的功能，所谓GPGPU其实是GPU整个功能的一个子集，它去掉了GPU用于图形渲染的一部分功能，主要用来做一些计算。

从英伟达的发展史来说，它其实一直都是在做GPU，它的GPU的产品，本身也包括了图形计算能力，同时也有并行计算，也可以做AI，它整个算力的有效性其实是更高的，更加具备通用性，包括它有一整套CUDA的软件算法，能够支撑非常广泛的应用。

英伟达其实一直没有强调自己到底是做GPGPU还是做GPU的，他强调的还是自己就是做“通用计算”的一个平台。

其实从我们投资角度，或者说产业/行业分析角度来看，GPU和GPGPU并没有特别本质的一个区别，只不过在国内可能因为一些技术上的原因，很多初创公司会选择一开始先不做图形功能，就只是把计算做出来，于是就有GPGPU的概念。我觉得从投资/行业发展终局/市场空间来说，GPU显然是一个更大的市场，因为它兼顾了图形、AI、高性能计算等等所有算力需求，可以做大量的跨界应用，不光可以做AI、科学计算，也可以做数字孪生，包括支持元宇宙的很多底层算法。

关于GPGPU，我觉得国内外很多公司更多是在做一些计算的加速卡。我们有个说法叫“domain-specific” （领域特定），主要是做计算加速，因此应用相对来说是比较窄的。严格意义上来说，比如我要做AI加速，本质上是用到图形渲染里非常小的一个子集，或者说所有算子里很小的一个子集，像矩阵向量的计算或者矩阵乘加的运算。

现在的问题就是，行业的发展非常快，像AI模型的发展速度是非常快的，不同模型之间的架构也很不一样。而现实是芯片本身研发需要周期，很可能你针对之前一个比较流行的模型做出来一款芯片，那么后面可能又有一个新的模型架构出来了，因此说这样的产品往往可能会应用比较窄，市场比较小。

最难的就是，怎么能够和现有整个GPU的应用生态去做兼容，因为GPU是一个非常通用的生态，生态本身已经是一个比较明确的体系。我们国产的玩家/公司，怎么能够更好和现有生态做兼容，光是软件甚至还有应用，包括大家的使用习惯。整体来说，我们也是觉得GPU方向是更值得去进行投资和布局的。

英博，其实我想知道你的研究里怎么看待这两种技术流派？您可以对应英伟达和AMD来给我们延展讲一讲，这两个流派的发展史，以及在中国的一些情况。

其实我做个类比，当我们回头去看这个事情的历史时，你发现它是有原因的。英伟达1993年成立，起于图形，兴盛于后面的通用计算，但是其实“通用计算”（人工智能计算、科学计算）在1993年并没有如此繁盛。直到它成立成立很多年之后，它发现自己做图形的功能改一改，迁移一下，就可以用来做“通用计算”，并且效果还不错。所以它其实是一个先有图形、后有“通用计算”的方式。它的做法也很简单，因为已经有了图形基础，就看能不能复用一些架构、功能去做一个延展，站在英伟达角度来讲，这个过程是很通顺的。

但是其他竞争对手比如AMD，包括后面其他竞争对手，如果自己没有极强的图形基础，面对蓬勃发展的通用计算需求，那就要面对一个想法选择：是像英伟达一样去做一个图形很强，同时兼容“通用计算”的方式，还是把图形放在一边，先把通用计算弄明白。这个时候按我们理解，所谓GPGPU，其实跟它进入的时间点的路线选择是有关系的。如果我们认为未来是元宇宙，那我们会发现人工智能通用计算跟图形渲染分不开了，因为元宇宙里是有非常强的视觉要求的。

其实英伟达一直在做一件非常聪明的事情，那就是软硬一体，在GPU本身硬件的半导体的基础上，它衍生出了基于通用计算要用的CUDA。CUDA这套软件的生态很恐怖，英伟达自己公布过，已经下载过并且在用CUDA的软件开发人员，2020年是一百七八十万，2021年到了230万，一年有60万左右的一个增长，到了2022年又变成350万，生态是快速增长。这个时候，英伟达就拿到了软件和硬件的双重规模效应。

在硬件端，因为它是图形和计算的统一架构，它的通用性保证了它有规模性，而规模性摊薄了它的研发成本，所以硬件上，本身它通过它的规模性可以拿到一个比较优势的研发成本。在软件端，因为它有庞大的开发者生态，这些宝贵的软件开发人员即便换了公司，可能还是在继续用CUDA，CUDA软件的星星之火还在持续燃烧。可以猜想，明年再开GTC（全球 AI 开发者大会）时，这个数字还会呈现可观的增长，它在软件上的生态就会更强大，软硬一体的路就走得会更顺。

传统PC时代大家都知道的芯片巨头AMD，其实1969年就已经成立了，但是1993年成立的英伟达，目前市值是AMD的三倍。二位刚才都多多少少分析了英伟达能够弯道超车的一些原因，我还想知道，这里边会不会有什么技术上的风口，或者是踩上了什么样的技术浪潮？

首先AMD是一家很牛的公司，尽管它在GPU里份额并没有那么高，但是不妨碍它在历史上曾经是一家非常优秀的公司。AMD创始人来自仙童半导体，它其实在上一代CPU为主的运算架构下拿到了比较明显的一个优势。

英伟达的成立时间更晚，在1993年，这段时间其实有点快进入到我们看到的Intel阶段，Windows加Intel，所以图形在PC上的应用越来越多，有更多的图形处理，就有更多的图形运算需求。这个时候英伟达1999年的第一款GPU，把它的图形又独立出去做运算，这是它背后的衍生过程。

再往后走，就是这家公司的迭代能力是非常快的，一旦它发现，它的产品可以更多用于相关领域/相似领域，它就会开始迭代。比如通用计算，图形渲染里最典型的应用是并行计算，为了加快图形的运算，它通过成百上千小的ALU的并行运算来加快了速度，就解决了CPU的瓶颈，而这种并行运算恰恰又是后面通用AI训练或者科学计算中所需要的并行运算的方式，速度会比较快，所以再加上它本身GPU架构具备一定通用性，那么速度通用性就达到了一个很好的平衡。那么另外再加上CUDA的软件生态，英伟达就逐渐筑起了自己的壁垒。

我非常好奇，英伟达和AMD这两个产品对比，芯片架构上有没有什么巨大区别？

我觉得还是有比较多的不同。我自己觉得有一点，英伟达其实是非常有恒心和毅力的公司，这可能也和创始人有很大关系，包括整个企业文化。不管在逆境还是顺境，都能坚持做长期且正确的事情，尤其当时看来根本就不知道是否正确的事情。

英伟达一直是在采用统一的架构，就是在一块芯片上能够去做图形和计算的功能。整体上来说，英伟达其实是一个架构，加上它比较大的软件生态，因此开发者在英伟达产品上开发的应用是能找到完美的兼容性和可一致性的。

AMD更多还是为不同产品线设计了一些专有架构，虽然在芯片上节约了少量面积，但其实是极大牺牲了它的应用的兼容性和可移植性的，很多跨界应用其实就没有办法做了。

现在AMD的确是在通用计算上面落后英伟达比较多，2010年左右，在图形上面，AMD的前身ATi给人的感觉是比英伟达还要更强的，但是今天看来，AMD反而变成了一个追赶者。那么作为追赶者，它希望能够用不同产品线的不同架构，希望能够提高效率，但最后实则牺牲了应用兼容性和可一致性，现在看来还是有一些得不偿失的。尤其在高性能计算的应用上面，AMD的市占率已经远远落后于英伟达了。

英伟达这家公司非常神奇，最早它是一个消费类的3D图形处理芯片供应商，可能最开始它也没有想到，今天会有这么大的一个市场。我也想请教一下英博，它这个业务拐点是在什么时候出现的？它是看到了什么机会呢？

我理解应该就是跟通用计算相关的这种机会。英伟达有一个很好的基础，在这个基础上，它可以用不同刀法切出适用于当时需求的产品。第一次切就是针对通用计算/智能计算这一块，后来其实它还切过，比如说像自动驾驶的芯片。最早它在车载的推理端其实并没有太大市场，但是它发现很多人可以用自己产品来做这个，那它其实也可以做，所以就有了后来Orin的这块市场。

反过来，我觉得这件事情不只是产品端的，它本身是带有创始人特质的。在一个通用的架构上苹果id账号美国，结合创始人的特质，然后不断去观察市场需求，关注他的用户在用他的产品做什么。他发现用户在用产品去改变某些东西，做某些功能，那他就化为己用，对自己产品不断进行迭代，所以我非常赞同于思说的，英伟达是一家有恒心有毅力的公司。它一直在做跟图形计算、并行计算相关的事情，一直没有换过方向，一直在做软硬一体的事情，可能在CUDA之后，这个事情被更进一步发扬光大了。最终它把它的一个通用架构和软硬一体的逻辑，应用在不同领域，所以它不断在寻找自己可能有机会的地方，这也是我们看到，英伟达比较宝贵的一个地方。哪怕中间一度面对因为CUDA导致有现金流压力，但它一直在坚持做这件“当时不知道正不正确，事后回来发现非常正确”的事情。

刚才二位不约而同都提到，英伟达成功的核心/关键要素之一，就是它有软硬协同中的软，有CUDA工具链和整个系统。我想请英博来给我们具体讲讲，CUDA到底有什么优于其他软件的特殊之处？它是如何帮助英伟达打通产品上下游的呢?

CUDA即Compute Unified Device Architecture，是一种聚合计算的架构，当然它本身是一种软件生态，那么在此基础上，它是把原来不容易使用的GPU，变成了更容易编程使用的GPU。

简单来说，直接使用机器语言去操作一些芯片，其实是比较不容易的，但是因为有了这个好的软件工具，我就能把人类的编程内容，翻译成机器能够理解的翻译内容，把一些功能封装在一起，更好去做这种调用。

在这种情况下，它就可以让更多程序员能够相对好入手地去使用这种工具，而使用越多，它所迭代的技巧和熟练性越高，程序员就可以用这个工具去做更多具备便利性、创造性的编程，而这种创造性就会体现在软件的思维逻辑上、软件本身的设计上，并不是如何更好去跟硬件打交道。所以我们判断，一个好的硬件，一定需要有一套好的语言坐在硬件和程序员中间，让它有一个比较好的操作便利性。

好东西，大家都想做，而做好一个事，肯定是在一个正确时间点开始做正确的事。当竞争对手已经筑起了比较高的壁垒时，这个成本和壁垒也在不断筑高，在这个过程中，英伟达是比较有前瞻性的。在它收入只有小几十亿美金时，它一年会拿出大几亿美金来做这件事情，那么这种迭代到现在接近20年时间，壁垒是很厚的。况且英伟达从来没有停止过奔跑，无论是它的两年一代的硬件架构，还是它不断迭代的CUDA软件的生态和功能，它其实是在不断奔跑。

很长一段时间的积累，且还在持续不断快速奔跑，这种通用性本身又带有一个正向的正激励制作用，通用性越好，生态越强，可能更想用的人更多，所以它是一个在加速的概念。如此一来，其他人想做就难。但难归难，并不是是完全没有可能。在外部国际环境变化的情况下，我们觉得有这个可能，但是可能要面对挑战和代价，毕竟英伟达当年也曾经为此付出过巨大代价。所以在这个过程中，保持自己的造血能力、融资能力，并且坚持下来，也就不是没有可能。

这几年芯片的火爆，于思我想问问你，芯片公司赛道里，在你判断做投资的时候，你选择的一个非常重要的标准是什么？

我觉得可能不是一个标准，而是一系列标准。我觉得首先肯定是看人，人才是第一位的。我说句实话，中国在人才历史上实在是欠了太多债。很多顶级人才其实是在欧美，那么你需要把他们吸引回来，包括你需要培养更多人才，这都是需要时间的。从另一方面来说，芯片创业又是一个机会窗口期，可能也就是这么几年，所以我觉得人肯定是第一位的。从商业到技术，到产品到组织，到生态建设到市场到销售，都没有短板的团队，我觉得这个是非常重要的。

第二毫无疑问还是看下游的应用，是不是一个很大的国产替代的机会，包括是不是一个很大的增量空间。GPU毫无疑问属于这样一个范畴，整个市场空间非常大，可能是个千亿人民币以上的市场。目前基本上是被国外公司垄断，所以肯定是有一个很大的投资布局的价值。

第三还是要看技术能力，毕竟芯片不管是设计制造，还是整个供应链管理，其实都是非常难的事情。这个公司是不是真的有这个技术能力，我觉得也是非常重要的。综合来说，还是要非常全面地去考察这些投资的标的，确保可以真正去伪存真，然后找到真正有潜力的创业公司去持续支持。

芯片行业是一个Winner-takes-all的市场，可能老大可以吃肉，老二可以喝汤，老三就不一定能啃上骨头了。因此我觉得很重要的也是需要判断，即使这些标准全部都满足，这家公司最后是不是能够成为赛道里最后的前几名，甚至能够成为第一名，我觉得这也是需要去把握的一个非常重要的点。

你刚才提到，人才其实是一个非常大的问题和痛点，关于人才引进这一块，于思能不能给芯片类公司一些好的建议？

我觉得有几点：第一肯定是需要意识到，人才战略是芯片公司可能排第一的战略。怎么能够招到好的人，就要用好各种招聘资源，不管是内部推荐还是校招，或者一些招聘软件或者猎头。我觉得这是一个公司级战略，绝对是CEO需要去重点关注的方向。

第二还是需要明确，我招过来的人是能够团结协作，拧成一股绳的，而不是互相不对付，最后变成公司内耗。芯片研发的试错成本还是很高的，因为每次都要流片，尤其是做这种先进的大芯片，流片成本也是非常高的，所以我觉得招到好的人和招到对的人一样重要。

第三还是要更有国际化视野。因为国内芯片的冷板凳实在是坐了太长时间，人才非常稀缺，是否有能力从国外去持续吸引这些顶级人才，我觉得这也是非常考验这个公司的。

第四可能不是一个人才战略，而是整个组织管理和公司文化的战略，在我看来也是非常重要的。很多公司可能注重把人招过来，以及招到对的人，但是你是否能够真的把人留下来，管理方式是否能够最大限度调动大家的积极性，减少内部的摩擦和内耗，最后能够又快又好地把芯片给做出来，做出来之后能够更好地变成产品销售给客户。

英博，以你的观察，目前中国整个芯片行业大概是个什么样的格局？都分布在哪些领域？

其实中国的芯片行业公司数量众多，数以万计，芯片之间的差异其实也非常大。那么主芯片的难度是非常高的，但是很多小芯片不用很大的团队也可以迭代起来。在这个情况下，中国的芯片产业在我看来方差是非常大的。结合刚才的问题，就是你想要真的把主芯片做到顶尖，人肯定是特别重要的一个事，那怎么能招到好人留住好人，我们不可免俗，就是你得有钱。

很多专业人员在长期坐冷板凳时，也要面对一个如何生活的艰难选择，所以公司要有钱，能持续不断来做这件事情。从经营性现金流的角度来讲，我觉得要么是公司有相对强的自我造血能力，但是处在早期，其实这事比较难，那换句话就是融资性现金流是公司非常重要的一个能力。

在这样一个大的行业，你要面对全球顶尖公司，去学习它。我们先不说比肩它，毕竟我们去学习全球最顶尖公司的过程，一定是一个漫长的持久战。我们又在相当长一段时间很难自我造血，这个时候你的融资能力，你的对外输血，要保持一个顺畅通道。那么这个时候，对于资本市场，无论你是二级市场还是一级市场，保持一个顺畅的造血通道就变得非常重要。

我想抛一个更大的问题：两年前，包括华尔街日报在内的外媒都认可的“摩尔定律”，已经被英伟达CEO黄仁勋的“黄教主定律”所替代，这个理论更强调人工智能的芯片性能每两年要提高一倍多，增长可以归因于硬件和软件的升级。我想问一下，二位认同这种观点吗？

我还是挺认同的。现在看来，像英伟达最新的H100、A100、V100的确都有一个显著的升级，而且它每年因为整个CUDA包括软件站的优化，在我同样的芯片平台上，我的有效计算能力其实也在不断提升，所以我还是挺认同黄教主的Huangs Law。

现在来说，芯片不断的算力提升，还是依赖于整个摩尔定律的提高。因为每代芯片也都会换台积电更新一代的工艺，那么到后面，因为摩尔定律可能到了一纳米或者再往下，毕竟会到一个头，那么是不是有一些更先进的封装，比如像Chiplet，或者像异质集成，或者像光电一体的计算，或者再往后更加远的一些新的计算。比方说量子计算，结合整个软件的生态的发展，包括结合整个应用，包括结合算法不断的发展。我自己觉得Huangs Law应该还是能够延续比较长的时间，肯定是比摩尔定律能够延续更长时间。

我基本同意，一条腿在跑赛道，一条腿在跑车，就是软硬件互相配合，以提高整体效率。目前我们尚未看到瓶颈，也许未来某一天，会长期面对一个瓶颈，但可能我们那个时候又面对了一个新技术。

今天这一期讲了英伟达，又讲了很多跟芯片方向有关的话题，相信很多听友听完之后都会意犹未尽。关于这个方向，二位嘉宾有没有什么好的书/纪录片/电影可以给我们推荐？

我觉得知乎上有非常多分析英伟达的文章，我建议大家都可以去读一下，我觉得写得还是非常好的，可读性很强。尤其是描写黄教主，包括英伟达每次的发布会，很多内容在YouTube、哔哩哔哩上也都有。如果大家对于处理器相关特别感兴趣的话，复旦大学的陈迟晓教授，他也把自己关于微处理器的一系列课程放在了哔哩哔哩上面，即使没有很强的技术背景，应该也可以对“处理器怎么一步步发展到GPU，以及GPU整个通用集团的架构” 有一个很好的一个理解。

如果要问我，我肯定说可以看我们的报告。如果说具体看书的话，我个人认为在CPU代际的时候，有非常多的书去描写当年硅谷发生了什么，这个是我自己也会去看的。对于当前代际的英伟达，可能还没有来得及有太多成书，这个时候我其实特别推荐于思刚才说的GTC。英伟达每年会有它的GTC，那么GTC发布会基本上是它把当年度最新的东西、最好的想法拿出来讲给大家听，如果仔细去看看，还蛮有意思的。

看了文字，不评论其它，只说一点。如果有了解大陆的芯片史，尤其是新世纪以来的奋斗史，会理解大陆和美国在这行业的阻击和反击过程，因为我们真的是从几乎一无所有的状态走到现在，拼的是一团火。当年入设计行时整个行业最大规模人员不过屈屈数十人而已，待遇也只能说中等偏上，到今天行业兴旺发达，靠的是不服周。

这点你无法和我们共情，恐怕也了解不了水下的努力，从来没有一帆风顺的登顶过程。】

作者从事半导体行业近20年，从01年台积电fab3工程师开始、06年到大陆成立了Arcotech，经历祖国半导体的建设大潮，也参与了02专项某项目，贡献自己一份力量，2020年从国内上市企业管理层离开后，目前有空写写文章，希望让更多的人了解国内半导体行业真实现状

这次BIS新规网上有点风声鹤唳，作者的文章屡次被山，此文受到许多来自行业内的关注，并在评论区以及私信给了作者高度的认可，各位的赞同给了作者写下去的动力，由于现在有点敏感，作者会在两个大小号以及多处发表，这篇文章我将大篇幅的来写写我所知道的国内半导体现况，不定时更新，有看过的小伙伴，麻烦不吝在顶一下，谢谢

这次BIS的超级重拳可能让中国半导体全产业链自主的大计划全部付之一炬，而且连带全球的半导体市场会经历一场腥风血雨。

初步来看禁令所带来的冲击力道甚钜，主要受创最大的就是国内，对美国而言则是利弊皆有；台湾与韩国则处境相似。长远来看，银弹口袋够深、研发技术够强的业者只要度过此波混沌乱世，后续可望突围续拼上位。

美扩大锁中禁令，对国内冲击甚钜，长达8年的半导体自主大计虽不至于回到原点，但也遭断手断脚，一日不解禁，半导体高科技产业发展将停在原地。

事实上，中国先前立下目标，除了2020年半导体产业要拉近国际大厂差距，16/14纳米制程要正式量产，接着2025年国内半导体自制率目标7成，到了2030年半导体产业中多家大厂要位居一线地位。

为此，郭嘉设立大基金金援半导体产业，若加上间接投资，约略估算国内半导体自主化所投入的资金超过人民币2万亿元。

北方华创、中微、拓荊等国内本土设备业者近年技术虽拉升有成，但与国际大厂仍有极大差距，难以全面取代进口设备，中芯、华虹等势将停留在28纳米时代，14纳米以下制程推进已断念，而再加上先前武汉弘芯与紫光集团等重大投资项目失败，国内闭门造芯的自主之梦大概率难以实现。

简言之，除了芯片业者若无美方政府许可，将无法出售产品给中企，而包括台积电等全球晶圆代工厂也不得为国内业者生产芯片。

此一事件与当年华为遭封锁不同，华为是单一事件，而此波禁令是全面性，影响了上下游产业链。以台积电来说，失去华为订单，但手机市场规模不变，由于其他手机大厂争抢市占，转采联发科、高通芯片，而苹果也受惠版图扩大，手上拥有3大厂订单的台积电也因此受益。

但此次国内AI、HPC进程发展遭灭绝，国内完全无法转采国际芯片大厂产品，自家比特大陆、平头哥、地平线等众多AI、ASIC等芯片业者生产也将受阻，转单效应暂时还看不到。

这次制裁新规定非常全面，信息量大，我用比较直白的说法来ㄧㄧ说明，各方面的影响

这三个方向几乎涵盖了中国芯片以及科技行业所需的要素，美国这一次修改之前法规的漏洞，意图全面围堵中国芯片及科技产业。

超算这部分中国相对成熟，这次将一大部分中国超算中心以及曙光、申威，飞腾等一众为超算中心提供芯片的全列为实体清单，而且这次加强最终用途的溯源审查，未来中国超算将没有先进芯片可用，自己设计给台积电制造也不行，全部都要追溯最终用途。

2015美国禁止至强芯片以来，中国超算开始进入自研阶段，其中以“神威·太湖之光”表现最为突出，曾连续四年蝉连世界第一。

“神威·太湖之光”部署在国家超算无锡中心，使用的申威SW26010芯片，最高主频1.5GHz，260个核，一共分4组，一组65个核，28nm工艺由中芯国际代工。

中国从2017年在E级超算领域就开始布局布局。无锡的“神威系列”、广州的“天河三号”和天津超算的曙光三个项目在进行。

2022最新的全球超算TOP500。中国没有提交新超算的资料，最好成绩还是只停留在第6的神威以及第9的天河2A。但外界普遍认为，中国对E级超算进展保密，防止来自美国的进一步限制。

不过从行业消息得知，中国的E级超算神威海洋之光和“天河三号”应该都已认证完成，曙光则没多大消息。

首先外购芯片的路子已经封死，不过好在2015年就开始封锁，最新一代超算芯片以自研多时，而美国也看到了漏洞，这一次追加了限制中国16nm以下的芯片设备。

其采用拥有4200万内核的处理器。其峰值性能达到每秒1.3百亿亿次。這是要高于目前世界第一的“Frontier”。

从有限的资料看来，神威海洋之光还是走堆料的老路子，从太湖之光的1065万内核提升的4200万内核，可以肯定的是继续由中芯国际代工，而且工艺大概率从SW26010的28nm，提升到16/14nm的工艺，但不排除继续使用SW26010。

天河2号超算之前使用的是Intel至强E5及Xeon Phi加速器，top10中唯一采用英特尔处理器的超算。

因为被美国限制，天河三号全面转向国产处理器。由于天河系列超算主要是国防科大主导研发，所以几乎可以肯定是使用飞腾公司的处理器。

早在天河1号、2号超算上就有应用飞腾的处理器，不过只是用在节点连接上，并不是计算的主力。

两年前飞腾公司想在Hotchips 27国际会议上公布了64核ARMv8处理器，不过因为飞腾就是国防科大的马甲公司，所以演讲者被美国拒签（国防科大被美国制裁）

早在2016年飞腾公司正式推出了处理器，跟申威一样都是28nm工艺制造，集成64个FC661核心，频率1.5GHz，最大功耗100W。

现在的天河三则是增强版，制程工艺提升到了16nm，也是TSMC代工，频率提升到了2.0GHz，依然是64个FC661内核，不过放弃了L3缓存，導致性能下降，不過内存控制器DDR3升级到了DDR4也算有部分提升。工艺的提升也大幅的提高频率。

根据飞腾公司透露出的消息，该款芯片单核性能跟Intel处理器还有较大差距，多线程性能与Intel主流的至强E5处理器相当。

神威海洋之光与天河三号都已经建置完成开始run了，明年的TOP500超算中或许有机会一见，反正该制裁都已经制裁到位了，也没必要再藏着掖着。

这一次飞腾，申威以及曙光全部被列入实体清单，所以飞腾在tsmc代工的FT-2000 Plus可以确定成了绝响，不过好在中芯国际可以做16nm，未来可以转单smic。申威则一直在smic代工影响不大。

可是最严重的问题来了，smic也不能出货给实体清单的企业，smic早在2020年被纳入实体清单，也就是说它需要美国的许可，显然美国是不可能同意的。

也就是说不论tsmc或中国的smic都不能帮飞腾，申威以及曙光代工，这才是这次新规的可怕之处。

也不是没有路可走，只能继续搞咱们中国人的小聪明。但必须有舍才有得。smic既然早就是实体清单，那干脆破罐子破摔，不再遵守美国规定，全面帮所有中国被制裁的企业生产芯片，比如华为，申威，飞腾等。

smic想全面决裂几个需要考量的，它是上市企业，这么做无疑是强盗逻辑，对购买股票小股东的洗劫，这是不负责的。如果要这么做，在这之前必须国家全面收购，让小股东有机会退出。

再来，smic未来将无法再获得任何全新的芯片制造设备，连现在所谓非美生产线也不行，也就是利用日韩台的设备也不行，全部封死，唯一一途只有等待全国产芯片生产线。（全国产产线涉及太广，下面制造的章节在全面讨论）

未来smic除了无法获得新设备以外，目前手上的设备也无法获得原厂维修，这一点是真正最难绕开的，也是smic为什么不敢破罐破摔的原因，即便如台韩这些芯片制造密集的地方，取代原厂parts的second source是非常发达的，但second source只能取代部分非核心parts，许多核心parts或者软件的bug都必须是原厂，我想不出有啥可以绕开的方法。

唯一可以赌的是这些设备能撑两三年，而三年后全国产产线横空出世。不过这赌注太大，开玩笑一样的作法。其实个人可以很确定全国产产线nm全部国产设备跟原料也不太可能，这部分我后面在详细解释。

現在的smic也只能走一步算一步了，儘量拖延儘量证明自己没有违反规定，保留生产线的美国设备未来数年能正常运转，如果能确保运转，以现在smic的设备，生产7nm没有问题，tsmc早在2017年就用相同的设备大量生产7nm。

smic已是实体清单，这一次的新规定，也确定smic无法再获得16/14nm以下的新设备，所以smic能做的是想办法偷偷给国内这些企业代工别让美国查出来，尽可能延长工厂运转，以拖待变，没有任何路可走。

所有使用smic代工芯片的企业必须全部静默，比如使用smic芯片的e级超算中心不再发布任何讯息，美国即便想溯源，可以以国家机密为由拒绝配合调查，以此来规避美国的溯源调查，但是华为这类消费产品可能就没办法这么干了，大街上可以买到的华为手机，给他代工不就是找死。

smic为了国家只能牺牲股东铤而走险，而中国的另一个芯片代工厂华虹，就不能轻举妄动了，中国必须保持一家没有被制裁的芯片制造厂，让其与国际接轨，这是唯一血脉。

如此一系列分析下来，这次的新规对国内一众超算芯片企业将是灭顶之灾，从制造端的根源围堵。实在想不出其他办法。

未来很长一段时间，中国的超算将依靠天河三以及神威海洋之光这两套e级超算，以及原本的天河，神威太湖继续发挥余热，至少十年内只能如此了。

这样的消息其实利好飞腾、申威、曙光这类处理器企业，毕竟中国未来还有很多大大小小到超算要建设，但没办法制造芯片让这一切成了无源之水。

超级计算机的应用领域逐渐拓宽，从国家安全、核武器研制、气象预报、石油勘探这样的国家战略领域，拓展到互联网、大数据、人工智能、基因测序、影视制作、金融等领域，惠及各个不同的行业，越来越贴近国民经济生活。例如，由于超级计算机的计算成本越来越低，且测序仪越来越快，基因测序的价格在快速地下降，从过去的每人每次几十万元，到现在的每人每次几千元。

超级计算机在飞行器设计尤其我国现在非常重视的超高音速装备等领域更是起到至关重要的作用。

2021年，世界500强超级计算机名单中，中国超级计算机有186台，美国超级计算机有123台。从超级计算机算力来看，美国超级计算机算力856.8Pflop/s，中国超级计算机只有445.3Pflop/s，从超级计算机制造商来看，联想现在是全球最大的超级计算机制造商。

在总运算能力上，美国超算的总运算能力依旧强于中国。从总算力占比上看，2021年6月美国超算占比为30.7%，中国超算占比为19.4%，差距较2020年有所扩大。

从全球top10到超算配置，我们可以很清楚看出，第6的神威太湖之光与天河2A，用了比别人多很多的内核，好几倍的单位能耗。

排名第一的美国Frontier采用工艺为7nm的amd epyc 64核 2GHz 总核873万核心，性能1102 PFlop/s，单位能耗19.1kw。

排名第二的日本富岳采用工艺为7nm的富士通自研a64fx 48核 2.2GHz，性能 442 PFlop/s，单位能耗67.6kw

排名第三的芬兰LUMI 采用跟第一名一模一样的7nm amd epyc 64核 2GHz，但总核只有111万核心，性能151.9PFlop/s，单位能耗19.3kw。LUMI是目前top10里面单位能耗最低的。

排名第四的美国summit采用14nm IBM 的power9 22核 3.07GHz + Nvidia V100 总核241万核心，性能148.6PFlop/s，单位能耗68.2kw。

排名第五的美国sierra 采用跟第四名一样14nm IBM 的power9 22核 3.1GHz + Nvidia V100，但总核157万核心，性能94.6PFlop/s，单位能耗78.6kw。

排名第六的中国神威太湖之光采用28nm 申威自研SW26010 惊人的260核 1.45GHz 总核高达1064万核心，性能93PFlop/s，单位能耗也是高达165.3kw。

排名第七的美国purimitter 采用7nm amd epyc 64核 2.45GHz，总核76万核心，性能70.8PFlop/s，单位能耗36.5kw。

排名第八的英伟达内部的seiene 采用7nm nvidia dgx a100 + amd epyc 64核 2.25GHz，总核55.5万核心，性能63.4PFlop/s，单位能耗41.7kw。

排名第九的中国天河2A 采用22nm 英特尔至强E5 12核 2.2GHz，总核498万核心，性能61.4PFlop/s，单位能耗达到不可思议的301kw。

排名第十的法国adastar采用工艺为7nm的amd epyc 64核 2GHz 总核31.9万核心，性能46.1PFlop/s，单位能耗19.9kw。

由以上可以看出，目前的top10，中国表现相对好的的神威太湖之光，以单位能耗来说是排名第一的8.7倍，是能耗表现最差排名第五使用IBM的sierra的2.1倍，而天河2A比原本就拉垮的神威太湖之光更拉垮，能耗还得再高1.85倍，与第一的Frontier相差到了匪夷所思的15.8倍。

所以从参数可以清楚了解，中国的两名确实是纯粹堆料，用更多的核心，超高的能耗挤进了前10。最新的神威海洋之光，总核比太湖之光多了4倍，达四千多万核，堪称堆料界的天花板，要知道目前性能世界第一的Frontier，总核也才800多万，比上一代的神威太湖之光的一千多万的总核还少。

这也是一直以来中国超算被诟病的问题，根源问题还是依赖补贴，而非靠市场生存，只要料堆的足，算力突破就有补贴，至于有没有人真的用的起，都是其次。当然也还是有不差钱的主，gov部门，国企都是主力客户，即便亏损累累，他们也不会有任何损失，毕竟他们诞生的宗旨并不是服务于市场。

超级计算在新能源、新材料、生命科学、人工智能、大气科学等领域具有重要作用，随着这些行业的迅速发展，超级计算的市场需求将逐渐拓宽，而超算云也迎来了行业爆发期。2017-2021年中国超算云服务市场规模从2.9亿元增长至20.7亿元，复合增速达到57.4%。

2022年2月，中国“东数西算”工程正式启，已经规划了8个国家算力枢纽节点和10个国家数据中心集群。如今美国出台新政策全面限制中国超算行业，这对中国所有需要算力的科技行业非常不利。

日本战略之父大前研一说过，“算力是未来决定一个国家国力的第一要素，超越军事，经济等传统要素。未来的世界是建立在算力之上的，拥有算力也就拥有了一切。”

很显然美国跟大前研一的看法相同，而且已然采取霹雳手段，企图直击中国要害，并妄想一招毙命，面对完全不利的局面，我们真的可以扭转乾坤？

笔者思前想后，其实美国这一次的制裁，也有可能让中国超算回归到真正追求单位能耗，能合理商用的现实层面来，鄙弃之前不计能耗，一昧堆料冲高算力的不实之风。

虽然我们没法取得也没办法拥有更先进的芯片制造能力，但28nm的芯片我们还是可以制造并不受限制，国家应该调整策略，深挖能耗潜能，以数量取胜。只要总算力不要被美国拉大即可，总算力才是等于国力，并不是什么单一最强的超算，靠堆料去争取形式上但一点用都没有的世界第一并不可取。

中国的超算在架构，算法，应用，能耗上还有大量可以深挖的潜力，因为这一直是中国超算做的最差的环节，即便没法争取世界前10，但拥有世界上最多数量的超算，在总算力上不落于人后，各行各业能用的起超算，充分享受超算带来的好处，真正做到从下到上的科技革新这岂不是更好更有意义。

BIS这次关于先进计算和半导体制造的最新规则，分三个部分实施，1. 涉及半导体制造的10月7号公布当日马上生效。2. 涉及台韩等美支持在中国的的半导体项目，公告五天后生效。3. 涉及超算的规则14天候生效。

超算的部分我们前面已经详细解释完了，这一篇就来聊聊这次新规对全球以及对中国半导体行业的影响

而对美国来说，虽然藉由多方管制而全面消灭了国内力图坐上半导体龙头企图心，且削弱其军事国防发展，但所付出的代价则是将现正陷入半导体供需反转危机的庞大美国半导体相关企业再火上加油。

以设备来看，全球前五大半导体设备厂中，美系就占三席，应材(Applied Materials)位居龙头，另有Lam Research及科磊(KLA)，总体营收估算，美国半导体设备企业营收合计约占全球近5成，影响力相当大，但主要营收成长动能除了来自台积电、三星电子(Samsung Electronics)与英特尔(Intel)等大厂外，近年国内全力扩产亦是关键，而一旦国内新厂建置放缓或卡关，冲击将超乎预期。

另一则是芯片业者，此次禁令将先前与NVIDIA、超微(AMD)有关的高端AI GPU苹果香港id和美国id，全面扩大至与高速运算、超级电脑等HPC产业相关的CPU、GPU、ASIC、FPGA等芯片，除冲击国内AI、HPC，甚至是量子运算产业发展外，由于自驾、电动车相关芯片也持续扩大采用AI等HPC芯片，车用电子发展也将受阻，NVIDIA、英特尔与高通(Qualcomm)等多家国际大厂也受难。

对台供应链影响方面，在芯片产业方面，联发科等众多业者不仅暂时没有转单，销中产品更可能受限，晶圆代工产业方面，目前国内仍有中芯、华虹停留在28纳米，16/14纳米也难转往GlobalFoundries、三星、台积电投片下单，而对原本就未承接中企订单且制程技术仍在28纳米以上的世界先进与力积电等厂则未有影响。

全球关注的是台积电，由于手握NVIDIA、超微、联发科、高通大单，也已承接英特尔订单，加上有比特大陆、平头哥等众多国内客户，以及南京厂也相当敏感，因此初估受伤程度随着美国禁令升级而扩大，还有2023年中半导体库存去化才会告一段落。不过，由于2023年拥有涨价与强势美元的有利汇率护体，应可将禁令冲击降至最低。

台积电先进制程保持绝对领先，虽直接失去国内客户与来自NVIDIA等大厂订单缩减，但各国在AI、HPC、车用与国防军事等半导体高科技领域发展仍需要台积电，其独霸地位将助其保持营运维稳且逐年成长。

g15Ln而由于中美冲突加剧，地缘政治风险急升，台积电继先前前往日本与美国建置新厂后，原本已无消无息的欧洲设厂计划又传出已重启。半导体业者表示，尽管市场不断传出台积电将修正资本支出，且欧洲建厂完全不具效益，但为分散风险及当地政府提供可观补助下，再度传出台积电将赴德国慕尼黑设厂，可能也采行与日厂模式，与欧洲业者合资运行。

这次新规针对中国半导体制造的新规则是10/7即可生效，不给任何反应时间，这方面规定的几个重点如下

1. 限制16/14nm或以下（即FinFET或GAAFET）的逻辑芯片制造设备。

这意味着中芯国际，华虹无法在获得相关的设备，无法在推进新工艺。未来中芯国际跟华虹只能扩建28nm产线nm以下的DRAM内存芯片的制造设备。

这意味着合肥长鑫这一代的1x还能生产，但是未来1y、1z、1α的生产设备将无法取得，以目前长鑫1x的工艺来看已落后三代，追赶三星、海力士、美光的大门关闭。

这意味着长江储存目前生产的128层nand未来无法在扩产。而128层现在是市场主流，但落后美光最新的232层两代。

4. 以上三点对于台韩等在中国的项目许可证可开绿灯，对于中国本地项目许可证将面临“拒绝推定”，“拒绝推定”就是说必须自己提出证据来扫除BIS相关规定的疑虑，这点无疑是不可能，白话来说就是以上相关设备不能也不会再卖给中国。

5.美国自然人或法人不可以在未经许可下，向中国开发这些制造设备的单位提供任何支持。

6. 长江储存，北方华创被纳入“未经核实名单”（UVL）名单，如果无法通过或者阻挠BIS的核实调查，则60天后自动归入实体清单。

7. 因主动配合调查，并满足了UVL名单的要求，此次有9家单位被从UVL名单中剔除。

这对今年屡屡传出捷报的中国记忆体芯片行业无疑是毁灭性的打击，这次的BIS的新规，直接把在摇篮中，而且形势喜人的中国记忆体芯片行业给活生生扼杀了。

目前他家主力就是1x工艺生产的ddr3、甚至ddr4的dram芯片。目前三星、海力士、美光都是1z，美光的1α已经准备量产，而三星甚至已经着手在下一代用EUV来生产dram的1β。合肥长鑫在全球dram的雄心壮志将止步于1x，落后现在主流2～3代，这将是长鑫与世界主流最小的差距，未来则越落后越多。

我们必须清楚记忆体芯片与逻辑芯片不同，记忆体芯片的唯一竞争力，就是成本，统一的设计比拼的是谁的工艺更先进，能在相同面积下塞进更多的晶体管。

早期的三星就是靠永远领先别人一代的工艺以及大胆的逆向投资，霸气的在dram行业大杀四方。

80、90年代把美国芯片霸主摩托罗拉，TI展落马下的日本三剑客NEC，日立，东芝。在90年后期无一例外被三星杀的丢盔弃甲，后来仓惶团报合并成的尔必达与欧洲巨头英飞凌分拆出的奇梦达最后还是难逃三星的追杀，纷纷倒闭。东芝退出dram依靠nand找到了救命稻草，镁光硬挺着成为韩国以外的唯一独苗，这场腥风血雨中被牵连的还有当初台湾雄心勃勃的的dram三剑客，如今只剩下南亚科成了美光的小跟班。（看来号称三剑客都都没啥好下场）

作者说这段历史，就是想说记忆体比拼的只有成本，更新的工艺更低的成本，做不到的话只有倒闭一途，不像逻辑芯片，做不了最先进工艺，我可以做成熟的利基型产品，GF跟联电宣布不再追逐先进制程，结果反而是赚的盆满钵满，一改之前长期被台积电压着打的颓势。

这是dram行业的特性，这次的新规定对合肥长鑫来说，是毁灭性的。而且还有一个重点是嗜血的三星还没出手，如果三星用原来的招数对付中国记忆体企业，凭藉新工艺压低市场dram价格，让你做的越多，亏得越多，他不用赚钱，但必须一定要你亏钱，长鑫能亏多久？人家只是少赚或者不赚，而长鑫这种工艺落后的只有血亏，日本台湾的dram过往历历在目。

不过长鑫的未来基本也可以预见，就是如当初台湾那几家dram厂一样，转型做foundry。如今的力积电，世界先进就是这路数，几乎没有其他路可以考虑，代工NOR也可以，不过就是对长鑫的设备来说有点浪费，可惜了。

就程序而言，只是在UVL名单的YMTC只要取得执照即可放行出货，而且60天内能配合并通过BIS的“最终用途调查”以及相关调查，即可剔除名单。

不过现在这态势看来已经没有任何可能，ymtc 在60天后进入实体名单，并拿不到任何设备已是板上钉钉。

这两年冉冉升起，并让人充满期待的ymtc大概率就此殒落。原本ymtc计划投资240亿美元，盖三座100k的工厂，成为梦幻泡影。

最糟糕的是进入调适最后攻坚阶段的武汉二厂，现在面临停摆的境地。amat、lam的工程师这两天已经开始撤走，目前的态势，应该是一片混乱的情况。设备商的法务肯定得与BIS经过多回合沟通才能定下来，到底啥能做啥不能做，这时候只能先行撤走工程师，留下ymtc在风中独自懵逼。

不过现在来说，啥能做啥不能做的大原则是非常明确的，128层不能做，但是上百亿针对128层的设备都买了，总不能丢下不管吧，尾款收不了，对设备商也是一个大损失，我想最终设备商还是得把设备调适完成交给ymtc并验收，但不能做128层，这方面的技术限制手段，细节我就不太清楚。反正结局基本上是如此，没其他方案。

但是如果不能做128层，只能做64层，那离倒闭也不远。128层是目前市场主流，单176层的高端产品三星、美光、海力士都已在2020年就推出了，最慢的铠侠去年也出了自己特殊工艺的162层。

而今年美光宣布在新加坡工厂量产232层，海力士明年量产业界最高的238层。

如果ymtc这个新工厂只能生产64层的产品，那会面临什么下场应该不用多说。不过ymtc应该会想尽办法出一个新工艺，规避bis的128层限制，接近128层但不违规，如此一来ymtc这接近128层的nand也足以让他在撑个两年。

两年后128层就成了中低端产品，长存的财务状况将会非常糟糕（建新厂高昂的成本摊提），不过政府输血基本也不会有多大问题，

NAND的工艺要求与foundry跟dram相比是比较低的，本来nand就是半导体全国产线的重点突破方向，ymtc的国产设备也是采购比例最高的，算是全国产线突破的尖子单位。

这不正中下怀，依个人看法，什么生产128还是176层的烦恼也抛开吧，ymtc一部分人该生产继续生产，一部分人全力搞全国产的设备，而且是真正在量产的fab里，所有设备back to back的调适，不是以前那种实验线，更不是一堆设备商各自为政，各说各话的吹牛皮。

再次之前不论smic，ymtc或者ㄧ众国产设备厂家，都是以生产然后销售为首要，毕竟企业要生存，那既然被逼到墙角，一点余地都不留，ymtc可以充当先锋，这两年不考虑盈利，生产放在第二，全力攻关设备，把调适出一条全国产设备的真正量产线为第一要务。

所有国产设备商全部齐聚ymtc的fab，把能做的不能做的老老实实说出来，真刀真枪全部在一个fab里搞，谁吹牛皮谁拖后腿，不会给能忽悠的空间。我一直认为国产设备的最大问题还是厂家的报喜不报忧，为了补贴搞形式玩文字游戏。如果任由这些骗补贴的再这样搞下去，一百年也搞不出啥来。

上海微那台号称90nm的ssx600通过郭嘉02专项验收合格，然后这一大帮人唱着歌，又定定了下一个目标193nmArF准分子激光浸润式光刻机，02专项继续攻关，大步迈进。

然而事实是那台ssx600，也就是248nmKrF光刻机，风风火火的把所有utility接上，除了认证那会开机跑了起来，至始至终躺在那，怎认证通过到咱们就不说了，你没跑产线，没有上下道的工艺配合，最后芯片合格率、良率到底行不行，全部都没有，这样就验收了。

大家能明白我的意思吗，这通过郭嘉验收的所谓光刻机根本无法在量产线上。

THE END

Shadowrocket（小火箭）新闻
# id # 卫星 # 导航系统 # gnss # 定位精度

全网最佳IP代理服务商-
4.8元解锁GTP.特价118/年

如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

苹苹果香港id和美国id果id账号美国

标签

全网最佳IP代理服务商- 4.8元解锁GTP.特价118/年如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

苹苹果香港id和美国id果id账号美国

标签

全网最佳IP代理服务商-
4.8元解锁GTP.特价118/年

如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等