在拉斯维加斯正在进行的 AWS re:Invent 大会上,AWS 推出了针对高性能 AI 工作负载的下一代Trainium 和 Graviton 芯片。根据 AWS 的说法,Graviton4 比 Graviton3 提供明显更好的性能、更多的内核和更多的内存带宽。Graviton 是专为云工作负载构建的人工智能芯片系列。

第二个芯片 Trainium2 是一款高性能芯片,旨在在 Amazon Elastic Compute Cloud (EC2) “UltraClusters”中大规模部署100,000 个独立芯片。这些 EC2 Ultracluster 旨在满足使用云的计算能力的可扩展需求。
根据GitHub 上的 AWS 官方技术指南,该阵容中之前的芯片也以高效率和高性能为目标。例如,Graviton3E 由针对云原生工作负载优化的可扩展 Arm Neoverse V1 CPU 提供支持。Neoverse V1使用可扩展矢量扩展SVE,使Graviton3E能够适应不同的工作负载。与传统的单指令多数据 (SIMD) 架构相比,SVE 允许处理器在运行时而不是编译时适应不同的向量长度。
向量可以被认为是并行处理的元素的集合。传统 SIMD 架构中向量处理指令的一个示例是Intel x86 指令 _mm256_add_ps 指令。该指令适用于固定大小的 256 位向量。或者,使用 SVE,计算中使用的向量的大小是在运行时动态确定的。对于需要较小计算的工作负载,可以使用较小的向量来提高能源效率。因此,AWS 称赞 Graviton 3E 的矢量处理性能提高了 35%,也就不足为奇了。
AWS 创建 Graviton4是为了进一步提高 Graviton3E 的性能和可扩展性。Graviton4 由 Arm Neoverse V2 CPU 提供支持,Arm 表示该 CPU 可以使 Graviton3E 中使用的 Neoverse V1 的性能提高一倍。
Graviton4还具有增强的安全功能。Neoverse V2 CPU底层采用ArmV9,由于其保密的计算架构,本质上比其前辈更加安全。除了拥有更大的 2 MB 二级缓存外,Graviton4 还实现了分支目标识别 (BTI),这是底层 Arm CPU 架构的另一个功能。这可以防止由于间接分支而执行不需要的指令,从而增强代码安全性。AWS 表示,Graviton4 的数据库速度提高了 40%,Web 应用程序速度提高了 30%,同时仍然强调安全性和可扩展性。
人工智能或机器学习技术最重要的一个方面是训练,即使用一组数据“教授”人工智能的过程。AWS Trainium 专门针对通过云进行高性能训练计算基础设施。
Trainium AI 加速器使用AWS NeuronCore 架构,每个加速器具有 32 GB 的带宽内内存,并提供高达 190 TFLOP 的计算能力。NeuronCore 具有用于张量多维数组计算、矢量处理和标量处理的独立引擎。
AWS 表示,通过部署在 EC2 UltraCluster 中,Trainium2 的训练基础模型 (FM) 和大型语言模型 (LLM) 的速度比以前快四倍。AWS 还允许访问其他令人垂涎的人工智能芯片,例如 Nvidia GPU。一些 Nvidia 芯片,例如 GH200 Superchips,将可以通过 EC2 服务访问。
相关文章:
3款高可靠性电路保护器件,更有效的过压保护
对讲机怎么用?对讲机怎么说话和接听?对讲机使用图解
英飞凌推出采用PQFN封装的15V沟槽型功率MOSFET
罗姆的新型高功率激光二极管可扩展激光雷达范围
开年第一梯《采购自助餐交流会》
三安半导体和Luminus Devices合作销售功率半导体芯片
2023最受欢迎十大产品,5G和物联网设计在电子元件方面占据主导地位
Neuchips 在2024 年消费电子展上展示面向个人电脑的低功耗人工智能升级产品
介电常数是什么意思?介电常数越大代表什么?
AV同芯插座的市场调查报告介绍
RF前端市场预计2023年至2028年将以10%的复合年增长率增长
英国法拉第电池挑战赛鼓励追求更轻、更先进且成本更低的电动汽车电池
意法半导体宣布推出1200V耐压、车用SiC功率电源模块
什么是网关?网关是什么意思?网关和路由器的区别
什么是寄存器?寄存器的作用是什么?寄存器和存储器的区别
芯时光乔迁仪式
ST推出STM32WL33xx系列新型低功耗、高灵活性无线MCU
适用于移动设备和可穿戴设备的4款电路保护器件
什么是位移传感器?位移传感器的原理与应用案例
2023年最佳游戏显卡排名前10名
具有四个 Arm Cortex-X4 内核的智能手机旗舰 SoC
什么是僵尸网络?僵尸网络攻击是什么意思?僵尸网络的危害
适用于 AI PC 的英特尔 Core Ultra 芯片介绍
怎么解除手机耳机模式?手机关闭耳机模式的方法
74hc595是什么电子元件?74hc595参数/引脚图及功能等中文资料
ddr3是什么意思?ddr2和ddr3有什么区别
Broadcom 在业界首次将神经网络引入交换机
视在功率是什么意思?视在功率有功功率无功功率的公式和关系
LVDS是什么意思?lvds接口是什么接口?LVDS接口的特点
iTunes备份文件在哪里?不同操作系统下iTunes备份文件的位置
Intel凭借酷睿Ultra处理器开启AI PC时代
以太网是什么?以太网属于什么网络
Microsoft通过新的AI加速器和CPU涉足定制芯片
IGBT是什么意思?什么是 IGBT模块? IGBT工作原理和作用
人工智能和内存安全是物联网安全的真正威胁
DOS是什么意思?windows常用DOS命令列表
Nisshinbo Micro Devices推出NB7142和NB7143系列锂离子电池保护IC
东芝电子扩展了其公司指定的“智能功率器件”(IPD) 范围
场效应管的符号、作用以及工作原理
stc89c52rc是什么电子元件?stc89c52rc的参数/引脚图及功能和应用领域
ON 的 Hyperlux LP 图像传感器可延长电池寿命
什么是熔断器?熔断器的作用与符号?
全球首款AMD Linux 游戏笔记本电脑首次亮相
DDR4是什么意思?ddr3和ddr4有什么区别
PL2303和CH340C哪个好?PL2303和CH340的区别
手机发热发烫是什么原因?手机发热发烫的有效解决方法
什么是占空比?pwm、boost电路、555定时器、lm324等占空比的计算公式
mhz是什么意思?mhz等于多少hz?mhz、khz、ghz换算
多芯片系统解决了芯片复杂性,但功耗是一个挑战
CDE的EMI抑制电容器,可在恶劣条件下工作