2025年10月9日,英特尔向业界揭示了其新一代客户端处理器——代号为Panther Lake的英特尔酷睿Ultra处理器(第三代)的架构细节。此次架构公布不仅标志着英特尔在AI PC领域的持续深耕,更有着里程碑式的意义:Panther Lake是英特尔首款基于全新Intel 18A制程工艺打造的处理器。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

▲英特尔CEO陈立武站在位于亚利桑那州钱德勒市的英特尔Ocotillo园区中,正手持代号为Panther Lake的英特尔酷睿Ultra处理器(第三代)的晶圆。

根据英特尔介绍,这款预计将于今年晚些时候开始出货的新品,汲取了前代产品Lunar Lake(酷睿Ultra 200V)在高能效上的优势,同时集成了Arrow Lake(酷睿Ultra 200HX)在强悍性能上的特点,旨在推动AI PC的规模化部署。

最近,英特尔公布了不少Panther Lake处理器在架构方面的资料,我们结合资料从制程、架构等多个维度对Panther Lake处理器的关键创新进行简单解析。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Intel 18A工艺:重塑性能与能效的基石

英特尔Panther Lake处理器的诞生,核心在于其采用的全新Intel 18A制程工艺。Intel 18A作为英特尔目前研发并制造的最先进的半导体节点,是英特尔首个2nm级别的制程,其设计目标是解决高性能计算在供电瓶颈、成本飙升和规模极限等方面的挑战。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

英特尔表示,Intel 18A制程工艺将作为核心技术平台,支撑英特尔未来至少三代客户端与服务器产品的研发与生产。目前,首款采用Intel 18A工艺的消费级处理器是Panther Lake处理器,而在服务器市场,首款采用Intel 18A工艺的产品是英特尔至强6+处理器,代号为Clearwater Forest。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Intel 18A工艺的核心创新体现在两大颠覆性技术上:RibbonFET(全环绕栅极晶体管)、PowerVia(背面供电技术)。RibbonFET技术标志着晶体管从FinFET鳍片结构向纳米薄片的进化。电流通道被栅极从四面完全环抱,从而显著增强了晶体管的开关控制和响应速度,并有效抑制了漏电。这不仅是物理尺寸的微缩,更重新定义了晶体管的控制逻辑,为后续摩尔定律的延展预留了空间。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

PowerVia(背面供电技术)将传统的信号和供电混合布线设计解耦,把供电网络下沉到晶圆的背部,而晶圆正面只保留信号互连。这种设计能有效缓解布线拥堵,将芯片密度和单元利用率提升10%,同时将供电压降减少约30%,为高频电路提供了更“干净”的电流。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

英特尔宣称,Intel 18A制程工艺的综合PPA(Power, Performance, Area)指标在业界处于领先地位。官方数据显示,相较于Intel 3制程工艺,Intel 18A的每瓦性能提升高达15%;在相似的性能水平下,Intel 18A可以将功耗降低超过25%。此外,Intel 18A工艺的芯片密度相较于Intel 3工艺节点提升了约30%。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在Intel 18A工艺的进展方面,据英特尔透露,Panther Lake处理器作为首款采用Intel 18A工艺的客户端处理器,其计算模块在美国亚利桑那州的Fab 52晶圆厂已投入生产,并预计于2025年第四季度实现大规模量产。目前,Intel 18A的量产良率已经高于英特尔在过去15年推出的制程节点。

CPU核心与混合架构:持久性能的源泉

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在封装方面,Panther Lake处理器采用英特尔成熟的Foveros-S 2.5D封装技术,将不同的模块,比如计算模块、图形模块、基础模块、平台控制模块和填充模块等像“乐高积木”一样灵活组合,实现了可扩展的架构设计。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在SKU方面,由于Panther Lake处理器并未正式发布,所以英特尔没有透露太多信息,仅仅给出了一些大致信息。根据英特尔公布的资料,我们可以看到Panther Lake处理器目前仅定位于笔记本电脑、掌机等移动设备,在规格上有3种配置:8核心、16核心和16核心+12核Xe 3集显的配置。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

8核心产品:CPU最高8核心设计(4P+4LPE),GPU配备4个Xe 3核心,最高支持LPDDR5X 6800或者DDR5 6400内存,配备12条PCIe通道。

16核心产品:CPU最高16核心设计(4P+8E+4LPE),GPU规格与8核心产品一致(4个Xe 3核心),最高支持LPDDR5X 8533或者DDR5 7200内存,配备20条PCIe通道。

16核心加强版产品:CPU最高16核心,GPU规格大幅提升至12核Xe 3,同时最高仅支持LPDDR5X 9600内存,内置12条PCIe通道。

此外,以上3种配置的Panther Lake处理器都配备相同规格的NPU、IPU和Xe媒体和显示引擎,都支持英特尔Wi-Fi 7(R2)、蓝牙6和雷电5等连接特性。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在核心架构上,Panther Lake处理器虽然集Lunar Lake和Arrow Lake之长,但是它在核心架构的设计上依然有所变化,它的计算模块集成了新一代的P核和E核,最多可提供16个核心的配置。

Panther Lake处理器的能效核(Darkmont)同时也兼顾低功耗能效核的工作,有点像Meteor Lake那样的配置,只不过全新的Darkmont能效核的性能得到了大幅增强。

现在,每个核心都扮演着独特的角色。性能核(Cougar Cove)提供极致的单线程响应和生产力性能;能效核(Darkmont)擅长处理多线程和并行计算,加速游戏和内容创作;低功耗能效核(Darkmont)则专注于提升整体能效,优化日常功耗表现,共同为用户提供全面而高效的计算体验。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Panther Lake处理器的性能核采用全新的Cougar Cove架构,旨在提升单线程性能和吞吐量。全新的性能核采用增强的分支预测以及拆分乱序引擎,并拥有多达18个执行端口。

此外,英特尔在Cougar Cove性能核的电源管理中还引入了AI启发式学习算法,通过理解、掌握用户使用对CPU负载的实时动态变化,能够更好地调配内部的硬件资源,并对外部负载变化做到及时的反馈,这确保了核心性能的充分发挥,同时避免了不必要的能效浪费。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

根据英特尔公布的数据,在相似功耗下,Panther Lake的单线程性能相比Lunar Lake和Arrow Lake H提升了10%以上;在相似性能下,Panther Lake的单线程功耗相比Lunar Lake和Arrow Lake H降低了40%以上。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

能效核部分,英特尔此次从Lunar Lake的Skymont能效核的基础上升级到了新一代的Darkmont能效核,而且它不像Lunar Lake那样只有在低功耗能效核岛上,也不像Arrow Lake那样只在能效核上,而是既能够提供多线程的性能,又能够提供更好的能效。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Darkmont能效核的优化主要体现在分支预测、动态预取器控制、Nanocode和内存消歧等方面。Darkmont能效核现在可以预测更后面的分支,并且可以提高准确性,降低延迟。Darkmont能效核还具备更深的指令队列和更强大的内存访问消歧能力,以更好地应对多线程工作负载。在多核并行运行时,它可以更有效地处理内存依赖,减少不必要的等待和重试,从而提高执行效率。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

根据英特尔公布的数据,Darkmont在能效上的进步尤为显著。在相似的功耗水平下,Panther Lake的多线程性能比Lunar Lake提升了50%以上。更值得关注的是,在提供相似的多核性能时,Panther Lake的功耗比Arrow Lake H平台降低了30%以上。这表明Darkmont能效核在提升绝对性能的同时,能效比也实现了大幅度的飞跃。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

值得一提的是,为了更好地发挥混合架构的潜力,Panther Lake还增强了硬件线程调度器,通过优化分类模型,实现对P核、E核和低功耗能效核(LPE-Core)的智能线程引导。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

英特尔特别提到Panther Lake在游戏中的核心调度。以《控制》这款3A游戏为例,在不分区的系统设定下,所有核都开放给系统调度,这个时候所有的性能核、能效核、低功耗能效核都会被调度起来去参与负载执行。

因为《控制》这款游戏是侧重于显卡的负载,CPU的负载占比并不大,所以按照这样的调度策略,每个核心都会被调度起来,这种模式下CPU会消耗过多功耗从而挤占iGPU的性能空间。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

如果系统在混合设定下,把CPU的负载集中在能效核和性能核上,不会分配到低功耗能效核上,通过这种智能调度调整,CPU的整体功耗得以有效控制并显著降低。这部分节省下来的功耗便可重新分配给iGPU,使其获得更多电力支持,从而显著提升其图形处理性能。最终通过调度的调整,《控制》的游戏性能有了10%左右的提升。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

此外,英特尔深度融合了平台软件和SoC精细化电源管理,推出了智能体验优化器。这项机制能够在后台根据实时工作负载,自动在预设的性能模式和更高效的节能模式之间进行无缝切换。与以往需要用户手动调整电源模式不同,这项功能现在是系统内置的,并且不依赖于特定的操作系统版本或外部IP。只要是搭载Panther Lake SoC的设备,在选择平衡模式时,用户即可享受到系统根据实时负载智能调配性能与能效。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

根据英特尔公布的数据,在UL Procyon生产力基准测试和CINEBENCH 2024单线程负载测试中,Panther Lake设备相比前代产品实现了高达19%的性能提升。这意味着,用户无需进行任何手动配置,在Panther Lake上就可以实现19%的性能提升。

集显升级到全新Xe 3架构:图形性能提升超过50%

在Panther Lake处理器上,英特尔提供了性能强大、支持更大配置的GPU IP,这能为用户带来卓越的体验,同时英特尔也对其吞吐量进行了优化。简单来说,Panther Lake处理器的集显基于全新Xe 3架构。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

从Xe 2到Xe 3架构的演进中,英特尔致力于将Xe 2的图形架构和AI功能扩展至更多设备。为此,英特尔对架构的可扩展性进行了创新。在集成显卡中,基本构建单元是渲染切片,每个渲染切片的核心组成单元是Xe Core,它也是核心计算单元,所有AI计算能力均由Xe Core提供。

在Xe 3架构中,英特尔将每个渲染切片中的Xe核心数量从Xe 2的4个扩展到6个,这一根本性的变化直接增加了单个渲染切片的计算密度和并行处理能力,这是Xe 3架构实现性能飞跃的基础。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Panther Lake的GPU提供了两种规格:4 Xe GPU、12 Xe GPU。4 Xe GPU的基本配置包含4个Xe核心、32个XMX引擎、4MB L2缓存、1个几何管线和4个光追单元等,这些组合在一起能提供出色的用户体验和性能。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

而规格最高12 Xe GPU则具备更强的计算能力,包含12个Xe核心、96个XMX引擎、16MB L2缓存、2个几何管线、12个采样器、12个光线追踪单元和4个像素后端。无论从计算能力、后端像素处理能力还是缓存能力来看,这都是非常强大的集成显卡。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在性能优化方面,Xe 3架构主要体现在关键的计算单元上。在Xe 3架构中,英特尔从引擎到切片都进行了全面优化,包括第三代Xe核心、更强的光线追踪单元、优化的Xe2矢量引擎以及更出色的图形专用硬件管线等。比如现在的第三代Xe核心单元提供8个512位矢量引擎和8个2048位XMX引擎,英特尔还将L1缓存增加了三分之一,这些改进共同赋予了Xe核心更强大的能力。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在Xe矢量引擎中,不仅线程数增加了25%,还添加了可变寄存器分配。通过增加线程数和可变寄存器分配,英特尔有效提升了Xe矢量引擎的使用效率,使得相同的硬件能够支持更多、更快的负载。同时,Xe矢量引擎还支持原生FP8反量化、SIMD16原生ALU、三路并发、扩展数据指令集与FP64,并全面支持Xe矩阵扩展。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Xe 3架构的XMX AI加速引擎是Panther Lake处理器提供高性能AI算力的主要来源,其矩阵运算能力有了爆炸式的增长,峰值算力高达120 TOPS。具体而言,Xe 3的XMX AI加速引擎每个时钟周期可执行1024个XMX TF32操作,支持2048个XMX FP16/BF16运算、4096个XMX INT8运算和8192个XMX INT4/INT2运算,这些都比上一代有了显著提升。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

同时,Xe 3架构拥有更强的光线追踪单元,支持异步光线追踪的动态光线管理,能够大幅提升光线追踪负载下的性能。总体上,Xe 3架构在硬件层面,从引擎到切片实现了全面优化,第三代Xe核心、更强的光线追踪单元、更高利用率的Xe矢量引擎以及更优的图形专用硬件管线等共同带来了显著的性能提升。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

根据英特尔公布的数据,Panther Lake的Xe 3 GPU相较于前一代Lunar Lake的Xe 2 GPU,图形性能提升超过50%。这一巨大增幅是更大的渲染切片(4 Xe变6 Xe)和更大的Die尺寸(支持12 Xe 配置)共同作用的结果。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

在保持高性能的同时,英特尔对能效比的追求也达到了新的高度。相较于更早一代的Xe架构(如 Arrow Lake-H处理器),Panther Lake Xe 3实现了超过40%的每瓦性能提升。这意味着Panther Lake在笔记本电脑、掌机等对续航和功耗敏感的平台上能够以更高的效率输出强大的图形性能。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

总而言之,Panther Lake在GPU层面进行了多项增强,包括第三代Xe核心、Xe矩阵扩展、12个增强型光线追踪单元以及下一代编码解码技术对新的编解码器的支持,还有高能效的媒体与显示引擎。如果不出意外,Panther Lake处理器内置的GPU或将拿下目前“最强集显”的称号。

XPU异构计算:平台AI总算力达180 TOPS

在AI PC的浪潮下,处理器的AI算力成为核心竞争力。Panther Lake处理器全面拥抱英特尔XPU异构计算架构,将CPU、GPU和NPU整合为统一的AI计算平台,提供了高达180 TOPS的平台总算力。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Panther Lake处理器的AI算力由三大部分构成,每部分承担不同的AI任务。其中CPU具备10 TOPS算力,主要提供快速响应的AI任务算力,例如ASR(自动语音识别)等对延迟敏感的前台任务。

基于Xe 3架构的GPU提供最高120 TOPS算力,利用其大规模并行计算能力主要处理对算力需求极高、突发性的高负载AI任务,例如大模型的本地部署运行。最后,NPU还可以提供50 TOPS算力,它专注于高能效、持续运行的后台AI工作负载,例如实时翻译、背景处理等。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Panther Lake处理器的NPU升级到最新的NPU 5架构,借助Intel 18A工艺,英特尔在NPU上也在提升芯片的面积效率。相对Lunar Lake的NPU 4架构,Panther Lake的NPU 5架构在每个神经计算引擎中都拥有更大的MAC单元,它们能带来更高的计算密度和运算效率。

因此,NPU 5架构相对于NPU 4最显著的变化是在相同的Slice中,每个Slice中的神经单元数量从6个减少到3个,但每个神经计算引擎的计算能力却得到翻倍,这有效提升了整体运算效率和Die尺寸的利用率。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

具体而言,NPU 5的每个Slice包含三个神经计算引擎,提供12K的矩阵运算能力、4.5MB的暂存器内存、6个SHAVE DSP以及256KB的L2缓存。这些配置相较于上一代均有稳步提升。更重要的是,通过架构和制程优化,NPU 5的单位面积下的TOPS性能比上一代Lunar Lake的NPU 4实现了超过40%的提升,这对于追求轻薄和长续航的移动设备而言至关重要。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

NPU 5架构的AI算力最高为50 TOPS,它原生支持FP8(8位浮点)数据类型并增强了数据类型转换能力。FP8相比INT8等定点数在精度上更具优势,同时能效远高于FP32,是当前前沿AI负载(如LLM)广泛采用的数据格式。此外,NPU 5还原生支持16x16x16 INT8 | FP8矩阵乘法/卷积操作。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

需要提一下,Panther Lake处理器还支持基于Transformer架构的XeSS 3技术,它可以利用GPU的AI算力实现更高质量、更高帧率的游戏画面,进一步提升了图形和AI的协同能力。

浅析英特尔Panther Lake处理器:Intel 18A工艺,多线程和集显性能狂飙50%

Panther Lake作为一个完整的客户端平台,它在连接性和媒体处理方面也进行了全面升级,以适应未来高性能和高带宽的需求。比如,处理器支持多达20条PCIe通道,为连接高性能SSD、独立显卡和其他外设提供了充足的带宽。在无线连接方面,Panther Lake集成下一代标准,包括雷电5、Intel Wi-Fi 7 (R2)和蓝牙6。

总结

总体来看,Panther Lake处理器是英特尔在制程、架构和IP创新上的一次集中展示。它不仅是首款采用Intel 18A工艺的客户端产品,其架构设计也为英特尔未来多代产品奠定了基础。

通过将Intel 18A的极致能效、Cougar Cove和Darkmont核心的强大计算能力以及XPU异构计算的AI能力相结合,Panther Lake成功地汲取了前代Lunar Lake(酷睿Ultra 200V)的高能效和Arrow Lake(酷睿Ultra 200HX)的强性能优势。

毫无疑问Panther Lake处理器的推出将重新定义英特尔AI PC平台的性能与能效标杆,为用户带来更持久的性能、更领先的AI体验和更具沉浸感的图形表现。目前只希望Panther Lake处理器如期出货,让消费者早点购买和使用到搭载这款全新处理器的笔记本电脑。