英特尔锐钜x显卡,英特尔锐钜xe显卡
chanong
|3月30日,Intel正式发布Intel ARC移动独立显卡(代号Alchemist)。自英特尔向消费者发布首款独立显卡产品以来,已经过去了24 年。此后,英特尔的独立显卡产品发展就陷入了困境。我们专注于核心显示开发。
经过多年的技术积累,英特尔针对服务器市场推出了DG1显卡,今年又正式推出面向消费者的英特尔锐炫ARC独立显卡产品,以及针对移动终端推出的A系列产品,首批将包括锐炫3/5 /7.型号。
其中,Intel Sharp 3主要针对主流游戏市场,Intel Sharp 5主要针对性能游戏市场,Intel Sharp 7主要针对发烧级硬核游戏。此次,英特尔推出了移动A系列A350M和A370M产品。全新Intel Sharp显卡支持XeSS过采样、全AV1硬件加速、平滑同步抖动滤波器以及深度链接能力,覆盖游戏、创意设计、功耗控制等全场景。
三星Galaxy Boo2 Pro轻薄产品,首款搭载Intel Sharp ARC的轻薄产品,已通过Intel Evo的严格认证,已在海外市场正式上市。
未来,多款搭载英特尔锐炫ARC独立显卡的笔记本产品将会推向市场,利用英特尔在处理器市场的市场份额优势。通过Intel Evo认证的产品还将进一步提高电池寿命和显示能力。
目前,宏碁、华硕、戴尔、海尔、惠普、联想、微星、三星、英特尔NUC等品牌或产品都有计划推出瑞轩独立显卡笔记本,并且通过瑞轩独立显卡,英特尔还可以将自己的产品集成在笔记本中。未来。然后启动您的第一台英特尔笔记本电脑。
英特尔夏普专有显卡产品的推出恰逢配套的英特尔夏普控制面板的推出,该控制面板集成了自动驱动更新、性能监控、性能调优、直播管理、游戏精彩片段生成、活动推广等功能。无需强制登录即可使用。
接下来我们就来详细了解一下全新Intel ARC独立显卡的底层架构和技术亮点。
英特尔锐旋ARC独立显卡产品底层架构基于英特尔Xe HPG架构开发,包含Xe Media Engine、Xe Display Engine、Xe Graphics Pipeline三大核心功能,采用内置XMX的Xe核心。
凭借Xe HPG 微架构,英特尔Sharp 显卡为您的开发过程带来了极大的灵活性。渲染切片是Xe HPG 微架构的基本模块。每个Xe HPG 渲染切片由4 个Xe 核心、4 个光线追踪单元、4 个采样器、一个几何引擎、一个光栅引擎、一个HiZ 引擎和2 个像素后端组成。
每个Xe核心包括一个XMX矩阵引擎、一个XVE体积引擎、一个光跟踪单元、一个采样器等,形成一个完整的组件。不同之处在于渲染切片由四个Xe核心组成,以不同的方式组合形成不同的SoC。形成各种产品形状。
Intel Sharp显卡通过叠加渲染切片形成最少2个、最多8个不同的产品线。不同的组合形成不同的产品。 Xe HPG 微架构还对光线追踪和DX12 Ultimate 具有良好的支持。
回到Xe核心,每个Xe核心提供16个256位XVE矢量引擎、16个1024位XMX矩阵引擎,并拥有192KB共享L1缓存。 XVE专有引擎用于执行传统的图像处理计算,而XMX矩阵引擎主要用于AI加速。
XVE向量引擎可以使用专用的FP浮点执行接口和共享的INT/EM执行接口在每个时钟周期执行16个FP32运算、32个FP16运算和64个INT8运算。 XMX 矩阵引擎每个时钟周期可执行128 次FP16/BF16 运算、256 次INT8 运算和512 次INT4/INT2 运算。
相比传统的MAC和先进的DP4a,XMX的计算能力的提升是相当显着的。我们知道MAC是图形学中使用的基本SIMD向量指令。每个时钟周期总共执行8 次并行乘法运算和8 次并行加法。 DP4a 针对不需要32 位精度的AI 计算进行了优化,每个时钟周期每个周期总共执行32 次并行乘法、32 次累加或64 次总运算,但这比标准SIMD MAC 多了4 倍。表现。
XMX 矩阵引擎通过深度流水线乘法累加运算将其提升到一个新的水平4。与DP4a类似,每个操作数被分为四个块,—— 64个操作在每个阶段——(由紫色图块表示)中独立相乘和累加。 —— 每个时钟在四个阶段生成256 次操作,性能比传统32 位SIMD MAC 提高了16 倍。
XMX改进的最佳应用是XeSS超级采样抗锯齿技术,与传统的高分辨率渲染相比,它可以在游戏中提供更高的性能。它帮助运动矢量通过神经网络从低分辨率渲染生成漂亮的高分辨率图像。分辨率与NVIDIA DLSS 类似的图像。
目前,XeSS超级采样抗锯齿技术预计将于今年夏天正式到来。首批支持XeSS的游戏包括《古墓丽影:暗影》、《超级房车赛:传奇》、《幽灵线:东京》、《死亡搁浅》、《血猎》、010-3。 00 00、《CHORVS》、《Arcadegeddon》 和14 场比赛。
瑞轩显卡通过Xe媒体引擎支持H.265/HEVC、H.264/MPEG-4/AVC、VP9、AV1等多种流行的编解码格式。
其中,Intel Radar显卡是第一家为AV1提供硬件编解码器加速支持的GPU提供商,并且这些类型的编解码器可以在非常低的处理器利用率下完成。由于AV1优越的效率,未来AV1也将成为主流视频格式。与H.264 和HEVC 相比,它更高效,可以以更低的带宽和更小的文件大小提供更好的图像质量。版税。
Intel Sharp AV1 显卡的硬解码功能相比传统软解码可提供50 倍的编码速度提升,现在FFMPEG、Handbrake、Adobe Premiere Pro、Davinci Resolve 和XSplit 在Sharp AV1 上均支持硬解码。为了
Xe显示引擎主要是针对当前和未来的显示技术而构建的,现阶段Intel Sharp Graphics支持HDMI 2.0b、DP 1.4a,还将支持DP 2.0 10G。借助Intel Sharp显卡,玩家可以享受2台8K@60 HDR或4台4K@120 HDR的最佳图像输出。
在游戏场景中,英特尔提供了多种同步技术来改善玩家体验,包括VESA标准的Adaptive Sync防撕裂技术和英特尔夏普显卡。 Speed Sync 是一项新技术,可以加快游戏当前帧的速度,关闭V-Sync 并渲染整个帧以实现低延迟和无撕裂效果。
Smooth Sync 是英特尔推出的另一项图像优化技术,通过模糊两个撕裂帧之间的边界来减少视觉失真,使图像显得更加一致和平滑。
性能方面:新推出的Intel Sharp独立显卡产品包括两种不同的SoC设计,代号为ACM-G10和ACM-G11。 ACM-G10 共有32 个Xe 核心和一个光线追踪单元、16MB L2 缓存、256 位GDDR6 接口、16 路PCIe 4.0 接口;ACM-G11 共有8 个Xe 核心和一个光线追踪单元、4MB L2 包括高速缓存、96位DDR6接口和8路PCIe接口。这两款芯片均包含两个Xe 多功能编解码器引擎和四个图像输出引擎。
关于频率问题,我们知道不同的频率有不同的要求和功耗,而事实上,笔记本根据日常使用场景,动态改变不同负载场景下的频率和功耗,往往是分布式的。基于这种分布,Intel Sharp显卡在分配参数时往往会设定一个代表性负载,并根据这个负载的频率和参数来定义显卡的频率。每个平台都有不同的TDP,因此随着TDP限制的放宽,整体时钟频率分布范围也会增加。
因此,Intel在此基础上划分了第一批五款A系列显卡产品,其中第一批瑞玄3 A370M拥有8个Xe核心和光线追踪单元,主频1550MHz,8GB GDDR6包含64位显存,以及三峡工程。瑞轩5 A550M包含16个Xe核心和光线追踪单元,主频900MHz,8GB GDDR6 128位显存,60-80W TGP;瑞轩7 A770M主频1650MHz,包含32个Xe核心和光线追踪单元,16GB GDDR6 256位视频内存,TGP 120-150W。瑞轩3产品已正式上市,瑞轩5/7将于今年夏天正式上市。
游戏性能方面,首发推出的瑞轩A370M显卡主要针对中高分辨率游戏,主打1080P帧场景的大型游戏。相比96EU Xe Core显示屏,帧率超过60帧。
在《杀手 3》、《堡垒之夜》等对帧率要求较高的游戏场景下,锐旋A370M的中高画质帧率超过90帧,达到流畅的水平。
在创意制作场景中,搭载A370M独立显卡的平台相比12代酷睿集成显卡也有显着的性能提升。在视频编解码方面,Davinci Resolve 提供从4K H.264 到H.265 高达60% 的性能提升。 AI相关功能的性能提升了一倍,包括Adobe Promiere Pro中的两个应用场景。
创意场景的提升不仅依赖于显卡本身,还受益于英特尔全新深度链接技术带来的显着提升。让我们看看深度链接是如何工作的。
Intel Deep Link技术除了在Intel Sharp Graphics和Intel第12代酷睿处理器之间动态共享功率外,Intel Deep Link技术不同于以往简单的动态功率共享,我们还引入了超级编码和超级计算能力。
动态电源共享技术可让您在系统功耗限制内最大限度地提高CPU 或GPU 性能。英特尔长期以来一直在研究这项技术。 2016年,在Kobe-Lake G时代,我们有了第一个动态功率共享版本,它在CPU和GPU芯片之间动态分配功率。
这一功能在当今的ADL和A系列独立显卡之间得到了进一步应用,在运行负载时,如果CPU需要更多功率,则将更多功率分配给CPU,反之亦然。此负载可提高性能。








