
【中关村在线原创行业评论】当前以及未来很长一段时间里,人工智能都将以前所未有的发展速度改变着人类社会的生活、工作、娱乐方式,从普通智能设备上的AI智能体到基于AI的自动驾驶,从医疗行业的AI诊断到金融领域的风险预测,从传统企业的AI数智化转型到现代化工厂里无处不在的智能制造,AI已经深入融合到人类社会发展历程中的各个角落。也正是因为如此,庞大数据量所引发的算力需求指数级增长,无时无刻不在对传统硬件领域发起挑战。
在这一背景之下,AMD等与AI行业紧密相关的半导体芯片公司,相继开始了为AI应用提供强大算力支持的新架构、新技术研发。就在刚刚举办的AMD ADVANCING 2025峰会上,AMD展示了全新的CDNA 4架构Instinct MI350系列GPU,预先公布了下一代Instinct MI400系列GPU,并且发布了全新的ROCm 7,正式推出了业界首款专注于AI领域的智能网卡设备AMD Pensando Pollara 400 AI NIC,同时还公布了以AMD EPYC为核心,基于Instinct MI350系列GPU以及Pollara 400 AI NIC打造的AI机架解决方案。
这也标志着AMD能够为行业带来全栈式的高算力AI计算解决方案。
·AI计算对核心硬件提出了更高要求
纵观近年来AI领域的高速发展,不难发现AI计算与传统计算领域有着天壤之别。AI大模型在训练和推理方面需要处理海量数据,并执行复杂的多元化计算任务,这对CPU、GPU、内存等核心硬件提出了更高要求。同时,如何为企业用户提供更加经济性的解决方案,也成为摆在面前的亟需解决的问题。
AMD EPYC处理器在这方面有着天然优势,强大的多核心、多线程能力,出色的能效表现以及卓越的TCO,使其能够轻松胜任各种高算力计算任务,配合AMD Instinct系列GPU可以显著提高AI训练和推理效率。
在AI模型训练中,CPU主要承担数据预处理、模型评估等相对较小数据集或相对简单的计算任务。此时,具有更高频率和更高能效比的处理器就能够更为高效地执行并完成这些任务。同时,AI大模型训练与推理并非一蹴而就,往往需要持续性地长时间工作,因此需要CPU这样的核心硬件具备出色的稳定性,并具备与 GPU、NPU、TPU等AI计算单元的协同工作能力,进而实现性能与能效之间的完美平衡。
·Zen 4/Zen 5架构EPYC实现底层架构层面的AI计算优化
AMD EPYC处理器之所以能够胜任当今越来越复杂的AI计算任务需求,可以说是从底层架构层面就打下了坚实基础。通过在Zen核心、Chiplet设计、指令集优化以及协同性设计等多个方面的不断革新与演进,充分适配了AI时代的硬件升级。
以Zen架构核心为例,第四代AMD EPYC所采用的Zen 4架构就开始展现出了显著的AI适应性。其凭借96核心单处理器设计,在整个业界实现了性能与能效方面的领先。与上一代产品相比,它能够提供高达2.8倍的性能提升,并减少多达54%的能耗。此外,它还能够提供完整的软硬件生态系统支持,能够更好地承载虚拟化、AI/ML、HPC等多种工作负载。对于AI计算尤为重要的一点是,第四代AMD EPYC处理器引入了对AI/ML应用程序至关重要的DDR5内存和PCIe 5.0高速通道。大内存、高带宽设计使其在参与AI模型训练和推理任务时能够提供足够出色的性能支持。此外别忘了,AMD 3D V-Cache技术的加持,进一步增强了第四代AMD EPYC处理器的多任务执行能力,并有效降低延迟。
而最新的第五代EPYC处理器则基于全新的AMD Zen 5架构打造。得益于在Zen 4节点的积累,Zen 5架构进一步强化了AI和HPC计算能力,不仅能够提供多达17%的IPC性能提升,还带来了更强悍的AI计算能力。例如基于64核心EPYC 9575F处理器打造的1000个节点组成的AI集群,其每秒可处理高达70万个推理令牌(Reasoning Tokens),极大地提高了处理效率;而得益于超高吞吐量优势,192核心的EPYC 9965处理器可为包括TPCx-AI(衍生)在内的端到端AI工作负载提供更高性能,为企业用户带来高效的大语言模型推理能力,助力其轻松部署DeepSeek R1、Llama等常见的本地化AI大模型,优化自身工作流,为企业办公提速。
·Chiplet设计助力AMD EPYC提供更加灵活的算力需求
除了架构优势之外,AMD EPYC处理器设计层面另一大亮点自然是采用了先进的Chiplet设计。通过将不同功能的芯片模块封装集成在一起,这种设计不仅提高了生产效率,降低了成本,还能根据不同的应用需求灵活组合芯片模块,实现更高性能和能效的同时,甚至可以满足定制化需求。
在当今的AI应用中,Chiplet设计使得处理器能够更好地满足对计算能力和内存带宽的高要求。例如在处理大规模AI模型训练时,通过合理配置不同的芯片模块,可以实现计算核心与内存之间的高效数据传输,避免数据传输瓶颈对性能造成影响,进而大大提高了AI训练、推理的效率。
·先进指令集与协同计算让EPYC直面AI时代的挑战
当然,先进指令集也是AMD EPYC处理器AI性能提升的关键要素。AMD通过不断优化指令集,使其能够更好地支持AI计算中的各种复杂运算,如AI计算中常见的矩阵计算、向量计算、卷积运算等方面,AMD EPYC处理器的指令集都有专门的、针对性的优化,帮助处理器在单个指令周期内处理更多的数据,显著提高计算效率以及大模型的训练和推理性能。
此外,AI时代对于硬件的挑战不仅来自于对单个硬件的算力需求,如何将CPU、GPU、NPU等各种计算单元有机结合在一起,充分发挥其协同计算能力,可以说是摆在每一个半导体芯片公司面前的问题。
AMD EPYC处理器无疑在这方面有着独特优势。通过优化硬件接口、提高带宽速率以及不断进化的通信协议,AMD EPYC处理器能够与GPU等硬件之间实现高速数据传输,以确保在AI任务执行过程中与不同硬件之间实现无缝协作,充分调度并发挥各自优势,更加高效地应对复杂的AI计算任务。比如在深度学习训练中,GPU负责处理大规模的并行计算任务,而CPU则负责数据预处理、任务调度等工作。AMD EPYC处理器与GPU之间的高效协同,能够使整个训练过程更加流畅,因此效率也更高。再比如在DeepSeek等大预言模型推理任务中,GPU事实上也并非是“唯一解”。负责执行各种程序指令,处理各种逻辑和算法的CPU,在这类AI计算中会发挥极大作用。更多的核心数、更高的内存带宽、更大的缓存容量以及软件生态层面的优化,可以助力其在相同功耗下实现更大幅度地性能提升。
当然,AI训练、推理之外,AMD EPYC处理器在智慧城市、工业物联网、医疗、零售等边缘AI场景中,同样也有着得天独厚的安全性与能效优势。如专为零售、制造、电信等智能边缘领域以及云服务、存储等数据中心场景打造的AMD EPYC 8004系列处理器就极具典型性。这一单路平台具备极为出色的高能效表现,它拥有最多64个Zen 4c核心,并支持6通道DDR5内存,设计小巧,非常适合空间、功率有限的部署环境。该系列针对云、电信网络、零售和智能边缘进行了性能优化,在低至70W的功耗范围内实现了更好的性能释放;同时该系列还通过了 NEBS(网络设备构建系统)认证,运行更为安静,适用场景极为广泛。比如在工业物联网中,通过在边缘设备中部署AMD EPYC 8004系列处理器,能够实时对生产数据进行分析和处理,实现设备的智能监控和故障预测,提高生产效率和产品质量。
·深度适配DeepSeek 推动AI普惠进程
今天,AI领域的飞速发展离不开DeepSeek等大模型的厚积薄发。它们的出现真正让AI走出实验室,落地到真正的生活化应用场景中。可以说,DeepSeek的出现加速了AI的普惠化进程,使得以更低成本实现最大化的性能与能效成为可能。
同时,第四代和第五代AMD EPYC处理器在与DeepSeek的技术与应用侧协同上,进一步推动了AI普惠进程。基于AMD EPYC处理器的强大算力,结合DeepSeek的先进算法和推理能力,企业用户可以实现对海量数据的快速处理与精准分析。在电商、医疗、金融、司法等等诸多领域遍地开花,推动了传统领域的数智化转型进程。
此外,在本次ADVANCING AI 2025峰会期间,AMD不仅推出了基于第五代EPYC处理器的AI机架解决方案,更公布了未来两年基于AMD EPYC “VENICE”以及AMD EPYC “VERANO”处理器的下一代和下下代高性能AI机架解决方案,为未来AI行业的算力发展描绘了更加清晰的前景。
·结语
在可以预见的未来里,AI算力指数级持续增长已然是现代和未来社会科技发展的底层逻辑。因此,更加高效的算力支持与更低的能耗表现将成为未来半导体芯片竞争的主旋律。
在本次AI峰会主题演讲中,Lisa Su博士谈到了AMD在AI领域的三大战略。为了实现AI的广泛部署,事实上并没有一种架构是“万能钥匙”,因此需要针对不同的使用案例选择合适的计算架构。基于此,AMD坚持为行业提供一系列产品组合,以便其客户可以将合适的计算设备与合适的大模型和AI用例相匹配;同时,AMD坚持拥抱开源生态,并加大投资力度,以实现对各类框架、库、模型的支持,以开放标准赋予行业生态更强的凝聚力;此外,AMD坚持为AI领域提供全栈式解决方案,并积极与合作伙伴共同构建生态系统。从产品组合的角度来看,AMD提供了最完整的计算套件,包括CPU、GPU、DPU、NIC、FPGA以及自适应引擎等,无论AI在哪里运行或需要多少计算力,AMD都有合适的解决方案给到行业用户与开发者。
此外,AMD EPYC处理器通过第四与第五两代产品的积累与持续演进,为包含训练、推理、边缘部署在内的AI全栈应用提供了性能、能效与成本之间更为平衡的支持。而伴随着AMD对于2026、2027年EPYC处理器的描摹,相信其在更加先进的架构基础之上,会为用户建立性能、能效更为出色的算力底座,并为AI领域的未来发展提供更加强大的动力。
本文属于原创文章,如若转载,请注明来源:驱动AI时代的核心算力引擎!AMD EPYC以技术创新助力加速AI普惠进程https://diy.zol.com.cn/995/9957437.html