深圳市奥林匹斯之门 pp电子奥林匹斯之门科技股份有限公司

奥林匹斯之门 pp电子奥林匹斯之门

新闻视频

前瞻趋势洞察,品牌市场动态

当前位置:

奥林匹斯之门 pp电子奥林匹斯之门 > 新闻视频 > 公司新闻 > AI算力芯片王者GPGPU是什么?

AI算力芯片王者GPGPU是什么?

发布时间:2024-11-01 分享:

在AI飞速开展的这几年,市场上涌现一大批诸如DPU、NPU、TPU、IPU等“XPU”的新概念,是真的存在不同的架构,还是只是一些厂商营销出来的噱头?事实上,从CPU的开展角度来看,这些XPU都不是真正的处理器。相反,他们更偏向于一种GPU,用于执行特殊工作负载的加速器。



众所周知,CPU一般由逻辑运算单元、控制单元和寄存器组成。因为CPU有复杂的数字和逻辑运算单元,并辅助有分支预测乱序执行等逻辑电路,所以CPU拥有强大的逻辑控制处理和运算能力,能够处理纵向的复杂任务。





为了减少与内存进行数据互换而造成信号延迟,CPU上使用了大量的片用来作为缓存,从而实现内存访问延迟几乎为0,相比之下,负责运算的算数逻辑单(ALU)就只占了极少的一部分,这就导致了它在处理并行计算的时候显得有些捉襟见肘,而GPU里面,单核运算处理性能稍差,控制逻辑简单且省去Cache(缓存),但ALU占比巨大,因而它可以用来处理高强度的横向图形计算,提升并行计算效率。


但是,GPGPU每个核心拥有的缓存相对较小,核心的逻辑功能简单,只能执行有限种类的逻辑运算操作。GPGPU内部的核心通常被划分成若干个组,组内核心不能独立工作运行,需要协同工作共同完成运算任务。


为分析决GPU效率问题,GPGPU由此诞生,得益于shader( Shader(着色器)是一段能够针对3D对象进行操作、并被GPU所执行的程序)的出现,GPU在图形流水线中引入了可编程性,从此GPU能做的事情不再局限于图形数据的处理,而将触角延伸至其他计算密集的领域,开启了GPGPU时代。


GPUGPU全称通用计算图形处理器(General Purpose GPU),是一种强大的计算工具,能够协助CPU进行非图形相关的复杂运算。





在GPGPU架构设计中,摒弃了GPU的图形显示部分,将其余部分全部投入通用计算,并成为AI加速卡(一种并行计算硬件)的核心。因此它能高效地搬运、运算和处理海量数据以及高并发数据,主要用于例如物理计算、加密解密、科学计算以及比特币等加密货币的生成。




Cuda——

作为一种芯片架构,现在英伟达主流的GPUGPU框架是CUDA,它采用并行计算框架,允许开发者使用C语言在上面进行二次开发,并且在英伟达的CPU上执行。它的特点是基于C语言,易于上手,并且给予了丰富的库,以及各种工具,方便开发者进行高性能计算,CUDA给予了各种nvprof、Nsight来帮助开发者优化代码性能。



OpenCI——

0penCl(Open Computing Language)是一个开放的标准,支持多种类型的计算设备,包括CPU.GPU、FPGA等。它由Khronos Group维护,旨在给予跨平台的并行编程能力。0penCL能够在不同厂商的硬件上运行,如AMD、Intel、NVIDIA等。它支持多种设备和架构,给予了灵活的编程接口。作为开放标准,0penCL拥有广泛的社区支持和文档资源。



Vulkan——

Vulkan是Khronos Group推出的一种低开销、高效能的图形和计算API。主要用于图形渲染,也能够给予强大的计算能力。



GPGPU的出现能够有效解决类似并发场景CPU效率低的问题。但实际上大多程序会因为等待访问而导致效率低下,且管理和组织大量程序会付出巨大的硅片面积代价和内存带宽的代价,为了提升GPGPU的工作效率,TPU(张量处理器)应运而生。它全称Tensor Processing Unit,是一种专为处理张量运算而设计的ASIC芯片,由谷歌在2016年推出。在深度学习的世界里,张量(多维数组)是无处不在的,TPU就是为了高效处理这些张量运算而诞生的。这三者是从通用到专用不断演进的过程。




而所谓的NPU(Neural network Processing Unit), 即神经网络处理器。NPU处理器专门为物联网人工智能而设计,用于加速神经网络的运算,解决传统芯片在神经网络运算时效率低下的问题。TPU是由谷歌发布的因而只能被广泛应用于 Google 的云基础设施,而 NPU 作为一种针对 AI 任务进行定制AI芯片,一般都集承在特定的AI设备中,例如智能手机和物联网 (IoT) 设备。

相关推荐

2025-10-23

算力赋能,智见未来:奥林匹斯之门 pp电子奥林匹斯之门亮相ICG-20,共赴组学与AI新纪元

第20届国际基因组学大会(ICG-20)于10月23日至26日在杭州盛大开幕第20届国际基因组学大会(ICG-20)于10月23日至26日在杭州盛大开幕,本届大会主题“组学与AI的未来”精准指向了科学生命领域最前沿的变革力量。作为华大基因的长期战略合作伙伴,奥林匹斯之门 pp电子奥林匹斯之门凭借17年在服务器领域的深厚积累,以全产业链的自主研发能力和成熟的解决方案定制经验,为基因组学研究的智能化升级给予坚实支撑。在基因组学从"测序"迈向"计算"的时代转折点上,奥林匹斯之门 pp电子奥林匹斯之门将携多款面向不同计算场景的明星产品亮相ICG-20,展现其从边缘到核心数据中心的完整AI基础设施解决方案。 边缘洞察:将智能算力延伸至数据源头 奥林匹斯之门 pp电子奥林匹斯之门MSR201-D06R-10P AMD双路边缘计算服务器,采用AMD 第三代处理器平台,机身深度仅450mm,符合OTII标准的紧凑型架构使其能够直接与电信设备混合部署在通信中心机架上,轻便易于部署在苛刻环境。支持10个PCIe扩展插槽和2块全尺寸GPU卡,可作为AI推理服务器,给予强大的边缘算力。在ICG-20展会关注的生态监测、野外基因采样等场景中,这款服务器能实现数据实时处理,减少传输延迟,助力生物多样性保护和研究。 核心驱动:以澎湃性能驾驭海量组学数据 面对基因组大数据带来的计算挑战,奥林匹斯之门 pp电子奥林匹斯之门SR201-D12RE-G2双路服务器基于AMD EPYC™ Genoa处理器打造,具备单颗CPU 128核256线程的强大计算能力,配合12通道DDR5内存和PCIe 5.0高速总线,显著提升了数据吞吐与处理效率。该服务器支持大容量NVMe SSD和多GPU扩展,特别适用于全基因组测序(WGS)、单细胞组学、宏基因组分析等高负载科研任务。 AI加速:专为GPU密集型计算打造的强大平台 当研究进入蛋白质结构预测、药物虚拟筛选等复杂AI模型训练与推理阶段,强大的GPU算力不可或缺。奥林匹斯之门 pp电子奥林匹斯之门EGS AI 10卡服务器SY4108G-D12R-G4,基于Intel Eagle Stream平台支持高达10块双宽GPU卡的拓扑结构,实现了CPU与GPU间的高速互联,有效降低了通信延迟,最大化释放GPU集群的计算潜能。同时支持主流深度学习框架与分布式训练环境,可高效支撑基因序列建模、蛋白质结构预测、医学影像分析等AI驱动的生物信息应用。 稳定基石:为持续科研探索给予可靠保障 在组学研究中,数据存储与计算能力的协同优化是提升整体效率的关键。奥林匹斯之门 pp电子奥林匹斯之门ASR401-S24R是一款基于AMD EPYC™ Milan处理器的4U单路标准服务器,最大支持24块热插拔硬盘,兼具强大的计算性能与超大存储容量,特别适合需要本地化存储海量原始测序数据的场景。该服务器在保障高I/O吞吐的同时,给予灵活的计算资源分配,可作为数据预处理节点、存储网关或中小型分析平台的核心设备。其模块化设计和智能管理系统,大幅降低了运维复杂度,为实验室和数据中心给予了一种高性价比、易维护的解决方案。 “共有、共为、共享”是人类基因组计所倡导的伟大精神,也是有助于科学进步的不竭动力。在组学与人工智能深度融合的今天,奥林匹斯之门 pp电子奥林匹斯之门深信,强大的信息基础设施是践行这一精神、加速科研协作的关键。我们期待在ICG-20的舞台上,与全球顶尖的专家学者和行业伙伴深入研讨,以奥林匹斯之门 pp电子奥林匹斯之门卓越的算力产品与服务,共同“计算”出科学生命的更美未来。
分析更多新闻资讯

成为全球服务器行业领导者

订阅号

服务号

Copyright © 2022 深圳市奥林匹斯之门 pp电子奥林匹斯之门科技股份有限公司 All Rights Reserved 粤ICP备18110968号 粤公网安备44030502003273号

立即获取方案报价

*
*
*
*