找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 153|回复: 6

[硬件] 六种GPU虚拟化

[复制链接]
  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
发表于 2025-2-4 20:38:31 | 显示全部楼层 |阅读模式
在大类上计算虚拟化技术有这3种: 软件模拟、直通独占(如网卡独占、显卡独占)、直通共享(如vCPU 、vGPU)。但对于显卡GPU而言我总结细化出至少这6种分类(其中第四、五种都是第三种的具体实现):
  • 第一种、软件模拟(eg sGPU), 又叫半虚拟化。
  • 第二种、直通独占 (pGPU) , 有的文章翻译为透传 。Openstack/KVM/ESX等IaaS场景用到。
  • 第三种、直通共享 (基于SR-IOV技术虚拟出vGPU) , 在技术上分类叫全虚拟化 。三个大厂有部分型号GPU支持,具体型号见 https://open-iov.org/index.php/GPU_Support 。这是AMD首先搞出来的,但似乎他们后来也转向GPU分片虚拟化了,这个网站AMD的产品反而没几款。
  • 第四种、GPU分片虚拟化(mediated passthrough),也属于全虚拟化技术。其热度很高,基于VFIO mediated passthrough framework的GPU虚拟化方案。该方案由NVIDIA提出,并联合Intel一起提交到了Linux kernel 4.10代码库,该方案的kernel部分代码简称mdev模块。把会影响性能的访问直接passthrough给虚拟机,把性能无关,功能性的MMIO访问做拦截并在mdev模块内做模拟。商业产品有NVIDIA GRID vGPU 与Intel的GVT-g系列,前者不开源,后者大部分开源。
  • 第五种、多实例 GPU (MIG) 技术,也属于全虚拟化技术。MIGNvidia 搞出的新技术,可将单个 GPU 分区为最多 7个完全的隔离vGPU实例,减少资源争抢的延时,提高物理 GPU 利用率。但可惜目前仅昂贵和国内禁售的NVIDIA A100 GPU 支持。
  • 第六种。Time-Slicing GPU (时间共享GPU)。把本来再空间上并行(时间独占)的成百上千的GPU流水线进行的时间维度的分割和共享。各个GPU厂家都有类似的技术。英伟达的技术文档:https://docs.nvidia.com/datacent ... st/gpu-sharing.html 。
注意,以上第四种是收费的,所以企业用户要去英伟达官网购买license。英伟达又卖硬件又卖软件license,赚钱能力真强。
第五种MIG则是买到昂贵的A100卡就能用了,不需要license。
普通玩k8s的企业,则用免费的Time-Slicing GPU (时间分片共享GPU)

PU技术特指主流GPU厂商推出的vGPU解决方案(如:NVIDIA GRID vGPU方案、AMD MxGPU方案)。传统云桌面模拟显卡没有提供主流的3D特性(如D3D、OpenGL等),无法运行大部分3D软件。使用vGPU技术能够解决云桌面中的以下问题,从而提高云桌面性能体验:
● 云桌面视频播放对CPU的利用率过高,使用GPU硬件解码可以减轻CPU的负担。
● 云桌面中大型建模、3D软件渲染依赖CPU,可以利用GPU的硬件编码减轻CPU的负担。
2 AMD vGPU技术
AMD MxGPU是全球首个基于硬件的vGPU解决方案,以PCIe标准中定义的SR-IOV(单根I/O虚拟化)技术为基础,实现每个物理GPU上有多个虚拟化用户远程工作。AMD MxGPU技术特点有
● 基于PCIe SR-IOV技术,将一个物理PCIe GPU变成多个PCIe vGPU,每个PCIe vGPU直接透传给虚拟机。
● 切分个数不一样(1–16,显存大小16MB对齐),vGPU设备ID一样,Guest Driver无需更新。
图2-1 AMD vGPU技术示意图





3 NVIDIA vGPU技术
NVIDIA vGPU,通过分片虚拟化技术,将物理GPU卡重新划分,同一块GPU卡经虚拟化分割后可分配至不同的云主机使用,实现了GPU(了解GPU云桌面)计算能力的多虚机共享。
NVIDIA vGPU技术特点有:
● vGPU以内核mdev虚拟设备呈现,uuid标识。虚拟机透传mdev设备。
● 图灵及之前架构的vGPU为纯软件mdev设备,而安培架构GPU也依赖SR-IOV技术。一个衍生出来的PCIe设备最多创建一个mdev形式的vGPU。
NVIDIA有四种vGPU类型,教学或办公通常只会使用到Q和B系列。
● Q系列:针对图形工作站,提供Quadro专业特性,需要vDWS授权。
● C系列:针对计算密集型的负载,如AI、深度学习。
● B系列,针对比较基础的虚拟桌面。需要vPC授权。
● A系列,针对虚拟应用。
物理GPU除了通用计算单元外,还会提供独立的硬件编、解码器,如NVIDIA GPU的NVDEC和NVENC模块。主要应用场景:解码器的视频播放、编码器的视频编辑等。
4 AMD和NVIDIA vGPU方案对比
AMD和NVIDIA vGPU方案各有特点,需要综合考虑应用场景、价格、扩展性等方面来做出选择。

表4-1 AMD MxGPU和NVIDIA GRID vGPU方案对比


AMD MxGPUNVIDIA GRID vGPU
物理GPU性能相同年份发布的GPU跟NVIDIA差不多相同年份发布的GPU跟AMD差不多
vGPU性能调度算法优化小,性能一般调度算法优化好,体验好
硬件编解码器S7150 MxGPU不提供vGPU都能提供
授权不需要授权vGPU需要授权才能释放性能
软件生态不完善,缺少配套软件及说明文档完善,软件生态及说明文档完善
成本较低非常高
供货不明确,基本被大厂垄断稳定
部署难度简单较复杂


  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
 楼主| 发表于 2025-2-4 20:41:13 | 显示全部楼层
AMD的虚拟化显卡 Firepro S7150 X2 16G。它是AMD的第一代支持虚拟化技术的显卡,2016年推出,采用双Tonga XT/Tonga PRO核心,每个核心8G显存共计16G,采用显存划分方式拆分,最小显存单位为512M因此它能拆分出32个虚拟显卡。

能拆分为32张虚拟显卡的AMD S7150X2

后面AMD还相继推出了AMD Radeon Pro V340 32G HBM ,AMD Radeon Pro V520 8G HBM ,AMD Radeon Pro V620 32G GDDR6 等虚拟化显卡。当然这些卡要么太贵,要么压根买不到。

所以只能给大家带来售价仅1200元的初代AMD虚拟化显卡S7150X2。

amd的初代虚拟化显卡一共三个产品,分别式单芯卡S7150,双芯卡s7150x2 和mxm形体卡s7100x。其中s7150有两种核心,分别是拥有2048个计算单元的Tonga XT和1792计算单元的Tonga PRO。采用了SR-IOV的方式来实现显卡虚拟化,相比较于nvidia的软件实现虚拟化性能损失要更小,同时还能不用软件授权费。nvidia的显卡虚拟化是需要缴纳GRID虚拟机授权许可费用的,价格并不便宜VPC授权方式一年需要100美元。而AMD的虚拟机显卡驱动是不用钱的。



这次我非常幸运的搞到了初期采用Tonga XT核心的s7150x2,拥有完整2048个计算单元。这是一装被动散热的显卡,在家庭环境下使用需要改造散热。我用一个8cm的风扇diy和纸盒胶布DIY了一个简易的抽风散热,不过风量太小效果比较糟糕。





这张卡需要SR-IOV才用使用显卡虚拟化功能,由于我的主板不支持SR-IOV功能无法使用显卡虚拟化功能,新买的X99服务器主板和配件也没那么快到,等到了以后才进一步测试。



另外这张显卡在启用虚拟化功能以后,显卡的编码器是无法使用的。只有Radeon Pro系列的虚拟化显卡才支持VGPU调用编码器。此外s7150官网仅支持ESXI平台,KVM可以通过开源驱动实现,但是稳定性不佳。虚拟机驱动仅支持windows7/10/11 64位版本,linux平台不支持。可以通过open Radeon Pro驱动在linux下驱动显卡,依旧稳定性不佳。
  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
 楼主| 发表于 2025-2-4 20:50:02 | 显示全部楼层
聊聊GPU虚拟化。
随着AI、加密货币等技术的发展,GPU在市场上“一卡难求”,这也导致GPU售价非常昂贵,而且供货周期也不稳定。
对于有GPU需求的企业用户,不但需要思考GPU卡的选型,同时需要考虑怎样尽可能高效利用GPU资源。为了提高GPU资源利用率,很多人选择对GPU进行虚拟化。


当然,除了提升资源利用率,GPU虚拟化还可以提供了良好的隔离性,从而确保虚拟环境之间的安全和独立性。另外,通过GPU虚拟化,用户还可以根据应用程序的需求动态调整虚拟GPU的计算和显存资源,实现资源的弹性扩展。
今天我们就详细聊下GPU的虚拟化技术。
▉GPU虚拟化的分类
相比于CPU虚拟化,GPU虚拟化人们了解的并不多。
目前,在GPU虚拟化大类上一般分为三种:软件模拟、直通独占(类似网卡独占、显卡独占)、直通共享(如vGPU、MIG)
下面我们来具体看下每一种的特点。
第一种,软件模拟(eg sGPU), 又被叫半虚拟化。这种方式主要通过软件模拟来完成,也就是大部分的KVM在用,主要原理就是在Host操作系统层面上建立一些比较底层的API,让Guest看上去好像就是真的硬件一样。
这种方式的优点是比较灵活,而且并不需要有实体GPU,当然没有实体GPU的缺点就很明显了,模拟出来的东西运行比较慢。另外就是这个方式并没有官方研发,因此产品质量肯参差不齐。软件模拟虚拟化就不讲了,因为真实场景太少,做做实验还将就用,几乎没法用在生产环境,毕竟性能损失太多。
第二种,直通独占 (pGPU) 。直通是最早出现,即技术上最简单和成熟的方案。直通主要是利用PCIe Pass-through技术,将物理主机上的整块GPU显卡直通挂载到虚拟机上使用,与市场网卡直通的原理类似,但是这种方式需要主机支持IOMMU。


因为直通方式的性能损耗最小,各大公用云厂商广泛采用直通模式,但直通方式相当于虚拟机独享GPU,因此硬件驱动无需修改。另外因为直通模式没有对可支持的GPU数量做限制,也没有对GPU功能性做阉割,因此大多数功能可以在直通模式下无修改支持。
GPU 直通的缺点是一张GPU卡不能同时直通给多个虚拟机使用,相当于虚拟机独占了GPU卡。如果多个虚拟机需要同时使用GPU,需要在服务器中安装多块GPU卡,分别直通给不同的虚拟机使用。而且直通GPU的虚拟机不支持在线迁移。
为了应对GPU直通不能共享GPU的限制,第三种方式直通共享的虚拟化方式出现了。直通共享在技术上分类叫全虚拟化 。实现原理是物理GPU虚拟化为多个虚拟机GPU,每个虚拟GPU直接分配给虚拟机使用,通过软件调度的方式在Host与计算机的Guest之间提供一个中间设备来允许Guest虚拟机访问Host中的物理GPU。
GUP直通共享方式是目前GPU厂商主推的技术趋势,接下来我们就详细介绍的下直通共享虚拟化这方面的内容。
▉不同GPU直通技术有何区别?
在本文开头介绍过,GPU全虚拟化的实现原理是将物理GPU虚拟化为多个虚拟机GPU,每个虚拟GPU直接分配给虚拟机使用。
目前,GPU全虚拟化技术先后有SR-IOV(开源技术) ,API转发、MPS还有vGPU 、MIG等,下面我们就详细看下。
第一种:PCIe SR-IOV
前文我们提到了GPU直通,这种通过PCIe直通GPU的方式只能支持1:1,不支持GPU资源分隔。于是为了解决这个问题,PCIe SR-IOV(Single Root Input/Output Virtualization)出现。
PCIe SR-IOV(Single Root Input/Output Virtualization)是一种更高级的虚拟化技术,允许一个PCIe设备在多个虚拟机之间共享,同时保持较高的性能。


PCIe SR-IOV通过在物理设备(Physical Functions,PF)上创建多个虚拟功能(Virtual Functions,VF)来实现的,每个虚拟功能可以被分配给一个虚拟机,让虚拟机直接访问和控制这些虚拟功能,从而实现高效的I/O虚拟化。基于PCIe SR-IOV的GPU虚拟化方案,本质是把一个物理GPU显卡设备(PF)拆分成多份虚拟(VF)的显卡设备,而且VF 依然是符合 PCIe 规范的设备。核心架构如下图:
PCIe SR-IOV的有点就是真正实现了真正实现了1:N,一个PCIe设备提供给多个VM使用;但缺点是灵活性较差,无法进行更细粒度的分割与调度;并且不支持热迁移。
第二种:API转发
在苦等PCIe SR-IOV期间,业界出现了基于API转发的GPU虚拟化方案。API转发分为被调方和调用方,两方对外提供同样的接口(API),被调方API实现是真实的渲染、计算处理逻辑,而调用方API实现仅仅是转发,转发给被调方。其核心架构示意如下图:
在GPU API层的转发,业界有针对OpenGL的AWS Elastic GPU,OrionX,有针对CUDA的腾讯vCUDA,瓦伦西亚理工大学rCUDA;在GPU驱动层的转发,有针对CUDA的阿里云cGPU和腾讯云pGPU。


API转发方案的优点是实现了1:N,并且N是可以自行设定,灵活性高。同时不依赖GPU硬件厂商。但缺点复杂度极高。同一功能有多套 API(渲染的 DirectX 和 OpenGL),同一套 API 还有不同版本(如 DirectX 9 和 DirectX 11),兼容性非常复杂。并且功能不完整,如不支持媒体编解码,并且,编解码甚至还不存在业界公用的 API。
第三种:MPS方案
除了PCIe SR-IOV,Nvidia还推出了MPS方案,这是一种算力分割的软件虚拟化方案。该方案和PCIe SR-IOV方案相比,配置很灵活,并且和docker适配良好。
MPS基于C/S架构,配置成MPS模式的GPU上运行的所有进程,会动态的将其启动的内核发送给MPS server,MPS Server借助CUDA stream,实现多个内核同时启动执行。除此之外,MPS还可配置各个进程对GPU的使用占比。
但该方案的一个问题在于,各个服务进程依赖MPS,一旦MPS进程出现问题,所有在该GPU上的进程直接受影响,需要使用Nvidia-smi重置GPU 的方式才能恢复。
第四种:MIG技术
也属于全虚拟化技术。MIG是Nvidia 搞出的新技术,可将单个 GPU 分区为最多7个完全的隔离vGPU实例,每个实例均完全独立于各自的高带宽显存、缓存和计算核心。


减少资源争抢的延时,提高物理 GPU 利用率。但可惜目前仅昂贵和国内禁售的NVIDIA A100 GPU支持。
由于MIG 是基于 NVIDIA Ampere GPU 架构引入的,仅有 Ampere 架构的 GPU 型号才能使用 MIG 方式。
第五种:Time-sliced GPU
这种方式是把本来再空间上并行(时间独占)的成百上千的GPU流水线进行的时间维度的分割和共享。各个GPU厂家都有类似的技术。Time-sliced 切分方式是按时间切分 GPU,每个 vGPU 对应物理 GPU 一段时间内的使用权。
在此方式下,vGPU 上运行的进程被调度为串行运行,当有进程在某个 vGPU 上运行时,此 vGPU 会独占 GPU 引擎,其他 vGPU 都会等待。所有支持 vGPU 技术 GPU 卡都能支持 Time-sliced 的切分方式。

  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
 楼主| 发表于 2025-2-4 21:10:53 | 显示全部楼层
显卡虚拟化。主要需求来自于我每天都会使用家里的几台虚拟机完成不同的工作任务。因为虚拟机没有显卡所以很多操作比较卡,用着不是那么顺手。也正因为也是办公使用,直通一张高性能显卡性价比比较低,也没法给多台虚拟机使用。
vgpu_unlock项目只支持Time-sliced技术,也就是单GPU实例性能会动态分配。如一张P4,如果只有一个GPU实例,那么多获得接近100%的性能,同时2个GPU实例,会分别获得1/2的性能。
BIOS设置
需要在主板中开启IOMMU(内存虚拟化相关技术)、VT-d/AMD-V(Intel/AMD家的cpu虚拟化技术)、Above 4G Decoding(pci-e寻址相关技术)、SR-IOV(PCIE设备虚拟化相关技术)功能。

研究了一段时间的GPU虚拟化,我感觉是up主讲的AMD和英伟达现在的本质上都是时分复用的gpu虚拟化方案,内部显存的分割,是为了实现上下文资源隔离和framebuffer的隔离。英伟达安培架构之后的mig应该就是真正能做到从空间角度的物理隔离,但是这也造成有可能gpu资源闲置的问题。奈何最早发力gpu虚拟化的英特尔,受限于集成显卡能力玩出花也没用。看了网上一圈资料,发现GPU虚拟化硬件已经不是问题后面玩的还是软件。光GPU虚拟化了也没用。还是要跟着其他虚拟化一块玩。英伟达这套玩的确实好


https://www.bilibili.com/video/av884739620/
起因是,我想搭建一个「真•All In One主机」,又能拿来远程串流游戏,同时又想着跑其他业务,比如转码之类的
于是就想:显卡能不能像CPU内存一样也能虚拟化,分给不同的主机?答案显然是可以的,只不过太折腾了。
原理其实Nvidia针对Quadro\Tesla等系列服务器显卡是可以开启虚拟化GPU功能的  官网介绍
只不过是在GeForce系列消费卡上禁用了该功能,我家里只有一张 2070 Super,显然不折腾一下是玩不了的
所以对例如我这种特殊的需求,有大佬开发了 nvidia-vgpu 项目来解锁这个限制,例如:vGPU-Unlock-patcher
限制30系及往后均不支持,手握30或40系的朋友就不折腾了~
以下型号的消费级显卡均支持vGPU
Maxwell 架构:(GTX 9xx、Quadro Mxxxx、Tesla Mxx),GTX 970 除外
Pascal 架构 :(GTX 10xx、Quadro Pxxxx、Tesla Pxx)
Turing 架构 :(GTX 16xx、RTX 20xx、Txxxx)

https://bugxia.com/3564.html




  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
 楼主| 发表于 2025-2-4 21:59:23 | 显示全部楼层
年来,显卡在 AI 模型训练高性能计算虚拟化部署 中的作用愈发重要。为了帮助您更好地选择合适的显卡,我们对 NVIDIA 专业显卡 系列进行了详细的性能对比,涵盖显存大小、虚拟化支持和适用场景,特别适合企业部署和图形设计的用户。
一、显卡性能与显存对比分析不同场景对显卡的性能和显存需求不同。从数据中心显卡到专业图形设计显卡,NVIDIA 提供了广泛的选择。以下是显卡性能和显存的对比情况:
[td]
显卡型号显存性能对标
NVIDIA A80040G/80GGeForce RTX 2080 Ti
NVIDIA A10040G/80GGeForce RTX 2080 Ti
NVIDIA A4048GGeForce RTX 4070 Ti
NVIDIA H10080GGeForce RTX 4090 * 1.4
NVIDIA L4048GGeForce RTX 4090 * 1.1
NVIDIA RTX A600048GGeForce RTX 4070 Ti Super
NVIDIA RTX A550024GGeForce RTX 3080 Ti
Tesla V10016G/32GGeForce RTX 4060 Ti
Tesla T416GGeForce RTX 3060
从表格中可以看出,NVIDIA H100 显卡A100 显卡 凭借 80G 的超大显存,非常适合 AI 模型训练数据中心高性能计算。而 A40 和 RTX A6000 显卡则兼具高性能和大显存,是专业图形设计和虚拟化的热门选择。
二、显卡虚拟化支持对比显卡的 虚拟化支持能力(vGPU) 是企业部署虚拟桌面(VDI)或云计算服务的重要指标。以下是部分显卡的 vGPU 支持情况:
显卡型号vGPU 17vGPU 16vGPU 15vGPU 14vGPU 13
NVIDIA A800--
NVIDIA A40
NVIDIA H100---
NVIDIA L40--
Tesla T4---
从表格来看,NVIDIA A40 显卡RTX A6000 显卡 的虚拟化能力表现极其出色,几乎支持所有 vGPU 模式,非常适合 企业虚拟化显卡 部署。这类显卡能够让多用户共享资源,提高系统利用率和性能。
三、显卡选择建议
在了解了显卡的性能和虚拟化支持后,以下是不同场景下的显卡选择建议:
  • AI 模型训练显卡推荐
    如果您的主要需求是 AI 模型训练高性能计算,建议选择 NVIDIA H100A100L40 显卡。它们拥有超大的显存和极高的浮点运算性能。
  • 企业虚拟化显卡推荐
    对于需要部署虚拟桌面基础架构(VDI)的企业,推荐选择 A40RTX A6000 显卡。这些显卡支持完整的 vGPU 模式,能够满足多用户的需求。
  • 图形渲染与设计显卡推荐
    如果您从事 3D 渲染、视频剪辑或其他专业设计工作,RTX A5500RTX A5000 是高性价比的选择。
四、总结与优化建议NVIDIA 显卡显存和虚拟化支持的对比 帮助我们发现了不同型号的优势所在。从 Tesla T4 显卡性能A40 虚拟化显卡能力,每一款显卡都有其独特的应用场景。在选择显卡时,请根据实际需求(显存大小、性能对标、虚拟化支持)综合考虑,找到最适合的方案。
  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
 楼主| 发表于 2025-2-4 22:06:21 | 显示全部楼层
NVIDIA vGPU 解决方案能够将 NVIDIA GPU 的强大功能带入虚拟桌面、应用程序和工作站,加速图形和计算,使在家办公或在任何地方工作的创意和技术专业人员能够访问虚拟化工作空间。
完整的 NVIDIA vGPU 方案包含 GPU 硬件与 vGPU 软件,将 GPU 硬件与 vGPU 软件解耦,能够使用户定期从软件的更新功能中受益,同时也为 IT 部门提供灵活性,以满足不同环境中用户的特定需求。
那么,如何选择能满足用户工作负载要求的 NVIDIA GPU 和虚拟化软件的组合方案呢?
今天我们从 vGPU 的许可类型、软件版本、支持的虚拟化平台、物理 GPU、虚拟机 vGPU Profile 等方面来介绍 NVIDIA vGPU 的软硬件选型指南,以帮助您选择适合不同工作负载的虚拟化软件和 GPU。
vGPU 许可类型的选择NVIDIA vGPU 目前包含三种许可类型,NVIDIA Virtual Applications (vApp)、NVIDIA Virtual PC (vPC)、NVIDIA RTX Virtual Workstation (vWS),原来的 NVIDIA Virtual Compute Server (vCS) 已合并至 NVIDIA AI Enterprise (NVAIE) 软件套件中,本篇不做阐述。那么,在日常的虚拟化应用场景中,如何选择合适的 vGPU 许可类型呢?

1 vApp
vApp 即 NVIDIA Virtual Applications(NVIDIA 虚拟应用程序)软件,专为应用程序流和远程桌面共享主机 (RDSH) 工作负载而设计。
2 vPC
vPC 即 NVIDIA Virtual PC(NVIDIA 虚拟 PC)软件,专为知识工作者 VDI 工作负载而设计,可加速以下软件和应用设备:
  • 办公生产力应用程序,如 Office 软件
  • 流媒体视频
  • Windows OS
  • 多显示器
  • 高分辨率显示器
  • 2D 电子设计自动化 (EDA)
3 vWS
vWS 即 NVIDIA RTX Virtual Workstation(NVIDIA RTX 虚拟工作站)软件,专为专业图形工作负载而设计,主要优势有:
  • RTX Enterprise 平台驱动程序和 ISV 认证
  • 支持 NVIDIA® CUDA® 工具包和 OpenCL
  • 更高分辨率的显示器
  • 具有大量帧缓冲区的 vGPU 配置文件
NVIDIA RTX vWS 可加速专业设计和可视化应用程序,例如:
  • Autodesk Revit
  • Dassault Systèmes CATIA
  • Esri ArcGIS Pro
  • Maya
  • Petrel
  • SolidWorks
  • ...
NVIDIA vGPU 软件版本及虚拟化平台的推荐
历经十多个版本的迭代更新,NVIDIA vGPU 软件已经更新到最新的 vGPU 16 版本,目前仍在支持的 NVIDIA vGPU 软件版本有 NVIDIA vGPU software 13、NVIDIA vGPU software 15 和 NVIDIA vGPU software 16,其各自的 EOL 日期如下:

考虑到使用日期和售后支持等方面,推荐使用 vGPU 16 版本。
vGPU 16.2 版本为例,其支持的系统和虚拟化产品如下,用户可以根据现有的虚拟化平台进行选择。
1 Citrix Hypervisor

2 Microsoft Azure Stack HCI

3 Microsoft Windows Server

4 Red Hat Enterprise Linux with KVM

5 Ubuntu with KVM

6 VMware vSphere ESXi

7 Nutanix AHV
该版本的 NVIDIA vGPU 软件支持 Nutanix AHV,基于 Linux 的 KVM 虚拟机管理程序。
未在列表中的、基于 Linux KVM 开发的其他虚拟化平台,需要和厂家确认是否兼容适配 vGPU 软件,建议实际测试,确定是否可以正常安装部署。
物理 GPU 的选择
NVIDIA vGPU 软件需要在具备 NVIDIA GPU 的平台上运行。vGPU 通过 time-sliced(时间切分)的方式共享 GPU 引擎,包括图形 (3D)、视频编解码引擎等,不同的 GPU 具备不同的规格,用户可以根据性能、成本和显存大小等因素选择合适的 GPU。针对目前仍在支持的虚拟 GPU 软件版本,支持的 GPU 有:

查看完整列表:
NVIDIA® Virtual GPU Software Supported GPUs​docs.nvidia.com/grid/gpus-supported-by-vgpu.html
虚拟机 vGPU Profile 的设定
可用 vGPU Profile 配置文件,在虚拟化教程 (2)虚拟化教程 (3)中介绍许可类型功能特性时有提到,包括 vWS 的 1Q/2Q/../48Q,vPC 的 1B/2B,vApp 的 1A/2A/.../48A,可以将其认为是给虚拟机分配的显存大小。
经常有用户会问:如何去设定 vGPU Profile,才能满足当下的应用场景和业务需求?
大致可以从以下三个方向去考虑:
首先,反推法,先确定当下使用的物理 GPU 型号,以及支持应用程序或业务工作负载所需的显存大小,再反推应该怎么去划分。
其次,可以根据具体的应用程序官方推荐的 GPU 和显存大小等硬件需求,来进行具体的 vGPU 文件的配置和显存划分。
最后,正向测试方法,比如设计类用户,考虑到运行模型大小以及复杂程度的不同,可以通过一些工具或寻求供应商来评估,获取 POC 支持和优化的方案。这里推荐两个工具:
1 GPU Profiler
GPU Profiler(GitHub 上可下载)是一个常用的工具,可以实时记录资源在虚拟机上执行工作负载时的利用率。该工具通常在 POC 阶段帮助调整虚拟环境大小,以确保可接受的性能。GPU Profiler 可以在具有各种 vGPU 配置文件的单个 VM 上运行。可以获取以下指标:
  • 帧缓冲区
  • GPU 利用率
  • vCPU
  • 内存
  • 视频编码
  • 视频解码
2 NVIDIA System Management Interface (nvidia-smi)
NVIDIA vGPU Manager 提供监控功能,让 IT 人员能够了解更好地利用 NVIDIA vGPU 的各种引擎的使用情况,包括帧缓冲区、编解码器等都可以通过命令行界面工具 nvidia-smi 进行监控和记录,并可以在 Hypervisor 或者虚拟机内进行访问。
适用于虚拟化工作负载的 NVIDIA vGPU 解决方案推荐
NVIDIA 虚拟化解决方案与基于当下 NVIDIA Ada Lovelace 和 Ampere 架构的 GPU 配合使用时,可提供巨大的灵活性和性能,从而满足当今企业不断变化的工作负载和组织需求。

▲ 推荐 vGPU 软硬件方案
如上图所示,如果追求最大限度地提高虚拟化工作负载的性能,可以考虑性能优化的 GPU,如果考虑到成本因素,则可以选择高性价比的 GPU。
当然,除了 NVIDIA 数据中心 GPU 之外,还有很多其他 GPU 支持虚拟化,包括 NVIDIA RTX™ 专业图形卡系列:NVIDIA RTX™ 5880 Ada Generation、NVIDIA RTX™ 5000 Ada Generation、NVIDIA RTX™ A5000 等。用户可根据具体需求,选择合适的 GPU 和软件。
*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。



  • 打卡等级:热心大叔
  • 打卡总天数:245
  • 打卡月天数:2
  • 打卡总奖励:7719
  • 最近打卡:2025-12-05 20:56:49

350

主题

557

回帖

1万

积分

管理员

积分
10407
 楼主| 发表于 2025-2-7 17:51:07 | 显示全部楼层
all in one玩家有没有遇到一个问题:在虚拟机平台上安装了操作系统,他们有的需要显卡来加速图形化界面才能获得流畅的体验,有的需要显卡来提供各种计算加速支持,比如常见编码解码,通用计算等等。虚拟化平台所提供的虚拟显卡并不能很好的完成这些任务,为满足需求只能将显卡直通给虚拟机。但是显卡有限不可能每个虚拟机都能分配到物理显卡,就算显卡充足主板所提供的PCI-E接口也不足以安装那么多张的显卡。
最好的解决办法就是显卡虚拟化
,将一张显卡拆分成多张虚拟显卡直通给虚拟机,让虚拟机可以共享物理显卡上的资源。目前显卡虚拟化只要有4个选择,nVidia GRID方案,AMD SR-IOV方案,Intel gvt-g,微软 GPU-PV
NVidia和AMD的需要专门的显卡才能开启显卡虚拟化,INTEL 在6代酷睿到9代都能使用,微软 GPU-PV仅限于较新的window10版本,WDDM 2.5以上,虚拟机系统只能是较新本的Windows10或以上。
github上有一个名为“vgpu-unlock
”的项目,这是一个用于解锁消费级显卡虚拟化功能的linux补丁,到今天已经它已经支持了大部分家用显卡。nvidia的专业卡和消费卡向来都是使用同一种核心的,通过VBIOS和驱动来区分。vgpu-unlock的作用就是通过欺骗驱动使驱动认为消费卡是专业卡,从而开启显卡虚拟化功能。
目前vgpu-unlock项目只支持linux平台,因此这次教程选择的虚拟化平台是大家熟悉的proxmox ve

注意:一张显卡同时只能使用一种GPU类型,以gtx 1060 6g为例子。要么使用1+1+1+1+1+1的6vgpu类型,要么使用2+2+2的3vgpu类型,要么使用3+3的2vgpu类型。1+1+4的类型是无法使用的


大家好,这里是极客买,这一期我们买了两张英伟达计算卡特斯拉P100-16G回来玩玩。
       先介绍一下特斯拉计算卡,这个是英伟达用于科学计算解决方案的GPU,基本都是没有显示输出接口的,纯粹用来做计算,相对普通的RTX游戏显卡来说特斯拉计算卡配备ECC纠错并且显存一般也更大。因为一般放在无尘机房服务器里面做计算,所以是没有散热器的,我们给配上散热器以及电源转接线才能在普通的PC平台使用,当然还得配一张输出显卡。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-12-7 08:44 , Processed in 0.031656 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表