电子发烧友网

电脑版
提示:原网页已由神马搜索转码, 内容由www.elecfans.com提供.
电子发烧友网>电子资料下载>电子资料>PyTorch教程23.5之选择服务器和GPU

PyTorch教程23.5之选择服务器和GPU

2023-06-06|pdf|0.30 MB|次下载 |免费

资料介绍

深度学习训练通常需要大量的计算。GPU是目前深度学习性价比最高的硬件加速器。特别是,与 CPU相比,GPU 更便宜且性能更高,通常高出一个数量级以上。此外,单个服务器可以支持多个 GPU,高端服务器最多支持 8 个。更典型的数字是一个工程工作站最多 4 个 GPU,因为热量、冷却和电力需求迅速升级,超出了办公大楼的支持能力。对于更大规模的部署,云计算(例如,Amazon 的 P3G4实例)是更实用的解决方案。

23.5.1。选择服务器

通常不需要购买具有许多线程的高端 CPU,因为大部分计算都发生在 GPU 上。也就是说,由于 Python中的全局解释器锁 (GIL),在我们拥有 4-8 个 GPU 的情况下,CPU 的单线程性能可能很重要。在所有条件相同的情况下,这表明内核数量较少但时钟频率较高的 CPU 可能是更经济的选择。例如,在 6 核 4 GHz 和 8 核 3.5 GHz CPU 之间进行选择时,前者更可取,尽管其总速度较低。一个重要的考虑因素是 GPU 使用大量功率,因此会散发大量热量。这需要非常好的散热和足够大的机箱来使用 GPU。如果可能,请遵循以下准则:

  1. 电源GPU 使用大量电力。每个设备最高 350W 的预算(检查显卡的峰值需求而不是典型需求,因为高效代码会消耗大量能源)。如果您的电源不能满足需求,您会发现您的系统变得不稳定。

  2. 机箱尺寸GPU 很大,辅助电源连接器通常需要额外的空间。另外,大机箱更容易散热。

  3. 显卡散热如果您有大量 GPU,则可能需要投资水冷。此外,即使风扇较少,也要以参考设计为目标,因为它们足够薄,可以在设备之间引入空气。如果您购买多风扇 GPU,安装多个 GPU 时它可能太厚而无法获得足够的空气,并且您会遇到热节流问题。

  4. PCIe 插槽将数据移入和移出 GPU(以及在 GPU 之间交换数据)需要大量带宽。我们推荐16 通道的 PCIe 3.0 插槽。如果安装多个 GPU,请务必仔细阅读主板说明以确保 16×当同时使用多个 GPU 并且您获得 PCIe 3.0 而不是 PCIe 2.0 用于额外插槽时,带宽仍然可用。一些主板降级到8×甚至4×安装多个 GPU 时的带宽。这部分是由于 CPU 提供的 PCIe 通道数量。

简而言之,这里有一些构建深度学习服务器的建议:

  • 初学者购买低功耗的低端 GPU(适合深度学习的廉价游戏 GPU 使用 150-200W)。如果幸运的话,您当前的计算机将支持它。

  • 1 个显卡具有 4 核的低端 CPU 就足够了,大多数主板就足够了。瞄准至少 32 GB DRAM并投资 SSD用于本地数据访问。600W的电源应该足够了。买一个有很多风扇的 GPU。

  • 2 个 GPU具有 4-6 个内核的低端 CPU 就足够了。瞄准 64 GB DRAM 并投资购买 SSD。两个高端 GPU 需要大约 1000W 的功率。在主板方面,确保它们有 两个PCIe 3.0 x16 插槽。如果可以,获得一块在 PCIe 3.0 x16 插槽之间有两个可用空间(60 毫米间距)的主板,以提供额外的空气。在这种情况下,购买两个风扇很多的 GPU。

  • 4 个 GPU确保购买单线程速度相对较快(即时钟频率较高)的 CPU。您可能需要具有更多 PCIe 通道的 CPU,例如 AMDThreadripper。您可能需要相对昂贵的主板来获得 4 个 PCIe 3.0 x16 插槽,因为它们可能需要一个 PLX 来复用 PCIe 通道。购买具有参考设计的狭窄 GPU,让空气进入 GPU 之间。您需要一个 1600–2000W 的电源,而您办公室的插座可能不支持。该服务器可能会运行得很吵很热你不希望它在你的办公桌下。建议使用 128 GB 的 DRAM。获取用于本地存储的 SSD(1–2 TB NVMe)和一组 RAID 配置的硬盘来存储您的数据。

  • 8 个 GPU您需要购买带有多个冗余电源的专用多 GPU 服务器机箱(例如,每个电源 1600W 的 2+1)。这将需要双插槽服务器 CPU、256 GB ECC DRAM、快速网卡(推荐 10 GBE),并且您需要检查服务器是否支持GPU 的物理外形。消费类 GPU 和服务器 GPU 之间的气流和布线布局存在显着差异(例如,RTX 2080 与 Tesla V100)。这意味着您可能无法在服务器中安装消费类 GPU,因为电源线间隙不足或缺少合适的线束(正如其中一位合著者痛苦地发现的那样)。

23.5.2。选择 GPU

目前,AMD和NVIDIA是专用GPU的两大主要厂商NVIDIA率先进入深度学习领域,通过CUDA为深度学习框架提供更好的支持。因此,大多数买家选择 NVIDIA GPU。

NVIDIA 提供两种类型的 GPU,针对个人用户(例如,通过 GTX 和 RTX 系列)和企业用户(通过其 Tesla 系列)。这两种类型的 GPU 提供了相当的计算能力。但是,企业级用户GPU普遍采用(被动)强制散热、更大内存、ECC(纠错)内存。这些 GPU 更适合数据中心,通常成本是消费级 GPU 的十倍。

如果您是一家拥有 100 多台服务器的大公司,您应该考虑使用 NVIDIA Tesla 系列或使用云中的 GPU 服务器。对于拥有 10 台以上服务器的实验室或中小型公司,NVIDIA RTX 系列可能最具成本效益。您可以购买带有 Supermicro 或 Asus 机箱的预配置服务器,这些机箱可以高效地容纳 4-8 个 GPU。

GPU 供应商通常每隔一到两年发布一次新一代产品,例如 2017 年发布的 GTX 1000(帕斯卡)系列和 2019 年发布的 RTX 2000(图灵)系列。每个系列都提供几种不同的型号,提供不同的性能水平。GPU 性能主要是以下三个参数的组合:

  1. 计算能力通常我们寻找 32 位浮点计算能力。16 位浮点训练(FP16)也正在进入主流。如果你只对预测感兴趣,你也可以使用 8 位整数。最新一代的图灵 GPU 提供 4 位加速。不幸的是,目前训练低精度网络算法还没有普及。

  2. 内存大小随着您的模型变大或训练期间使用的批次变大,您将需要更多 GPU 内存。检查 HBM2(高带宽内存)与 GDDR6(图形 DDR)内存。HBM2 更快但更昂贵。

  3. 内存带宽只有当您有足够的内存带宽时,您才能充分利用您的计算能力。如果使用 GDDR6,请寻找宽内存总线。

对于大多数用户来说,看算力就够了。请注意,许多 GPU 提供不同类型的加速。例如,NVIDIA 的 TensorCores 将一部分算子加速了 5×. 确保您的图书馆支持这一点。GPU 内存应不少于 4 GB(8 GB 更好)。尽量避免将 GPU 也用于显示 GUI(改为使用内置图形)。如果无法避免,请添加额外的 2 GB RAM以确保安全。

图 23.5.1比较了各种 GTX 900、GTX 1000 和 RTX 2000 系列型号的 32 位浮点计算能力和价格。价格是在维基百科上找到的建议价格。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QKSABLk8AAQpdDxjbJE760.svg

图 23.5.1浮点计算能力和价格比较。

 


评论

下载排行

本周

  1. 4.80 MB   |  43次下载  |  免费
  2. 2SM2246TX开卡资料分享
  3. 2.28 MB   |  12次下载  |  10 积分
  4. 3SM2246XT电路图
  5. 1.37 MB   |  7次下载  |  5 积分
  6. 4SW6306V四口多协议升降压移动电源SOC中文手册
  7. 1.20 MB   |  7次下载  |  1 积分
  8. 5Python语言基础3
  9. 30.00 MB   |  3次下载  |  免费
  10. 6自动控制原理–电子课件
  11. 1.09 MB   |  2次下载  |  免费
  12. 7OC7201C-汽车车灯应用DEMO
  13. 211.58 KB  |  1次下载  |  免费
  14. 8C++语言基础知识
  15. 0.47 MB   |  1次下载  |  免费

本月

  1. 1实用电子电路500例
  2. 5.33 MB   |  45次下载  |  1 积分
  3. 2Labview实现自定义四维云图(三维曲面图像)可视化显示
  4. 4.80 MB   |  43次下载  |  免费
  5. 3TI 10kW双向三相三级双向三相三级型 逆变器和逆变器和PFC参考设计
  6. 6.22 MB  |  31次下载  |  免费
  7. 4基于51单片机TEA5767收音机数码管显示设计
  8. 0.69 MB   |  15次下载  |  10 积分
  9. 5SM2246TX开卡资料分享
  10. 2.28 MB   |  12次下载  |  10 积分
  11. 6开关电源芯片电路图集
  12. 25.83 MB   |  12次下载  |  1 积分
  13. 7PCB及电路设计的接地资料基础
  14. 0.42 MB   |  11次下载  |  免费
  15. 8SW6306V四口多协议升降压移动电源SOC中文手册
  16. 1.20 MB   |  7次下载  |  1 积分

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935107次下载  |  10 积分
  3. 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
  4. 1.48MB  |  420061次下载  |  10 积分
  5. 3Altium DXP2002下载入口
  6. 未知  |  233082次下载  |  10 积分
  7. 4电路仿真软件multisim 10.0免费下载
  8. 340992  |  191351次下载  |  10 积分
  9. 5十天学会AVR单片机与C语言视频教程 下载
  10. 158M  |  183327次下载  |  10 积分
  11. 6labview8.5下载
  12. 未知  |  81576次下载  |  10 积分
  13. 7Keil工具MDK-Arm免费下载
  14. 0.02 MB  |  73801次下载  |  10 积分
  15. 8LabVIEW 8.6下载
  16. 未知  |  65984次下载  |  10 积分