无论是虚拟化平台还是NVIDIA vGPU软件都在不断的更新迭代中,新的软件版本会为用户带来更完善的功能和强大的性能以及安全性和稳定性。所以一般来说,软件厂商都会鼓励用户升级到最新的长期支持的版本,以获取更好的体验和持续的厂商支持。今天我会把之前一台用于测试的服务器进行虚拟化平台和vGPU软件的升级,都分别升级到最新版本,此文档主要用于记录整个升级过程,供各位合作伙伴参考。
此次升级的软件版本如下:
Citrix XenServer 7.2 --- > Citrix Hypervisor 8.1 (支持多vGPU分配到虚拟机)
Citrix Hypervisor 8.1的详细新功能可以参考:
https://www.citrix.com/downloads/citrix-hypervisor/product-software/hypervisor-81-premium-edition.html
NVIDIA vGPU 6.1 --- > NVIDIA vGPU 10.1
NVIDIA vGPU 10.1的详细新功能可以参考:
https://docs.nvidia.com/grid/10.0/grid-vgpu-release-notes-citrix-xenserver/index.html
接下来,我们看一看整个升级过程,首先进行服务器虚拟化平台升级。
从Citrix官方网站下载最新的8.1版本的ISO镜像,然后通过服务器的IPMI进行远程升级安装。安装之前请确保对之前服务器虚拟化平台的数据进行必要的备份,防止升级发生意外情况,导致数据丢失。
启动安装镜像后,按回车键即可开始安装
键盘设置建议选择us类型
接受用户协议后,才可以进行安装
选择直接升级现有的虚拟化版本XenServer 7.2.0
提示安装会覆盖之前备份分区的信息,新的安装完成以后会基于当前的软件版本构建新的备份分区,这里我们选择Continue继续即可。
此处选择安装源,由于我们是远程挂载ISO到本地所以选择Local Media。
跳过对ISO安装介质的校验,以节省安装时间。
安装正式开始
选择不进行额外的功能包安装
安装完成以后断开之前挂载的ISO镜像,并重启后Citrix Hypervisor会自动完成初始化,然后就可以通过XenCenter连接使用。
重启后我们可以看到如上图所示的Citrix Hypervisor界面。但是我们通过之前版本的XenCenter进行管理的时候会提示不兼容,需要下载最新的版本。
我们在Citrix官方网站下载最新的XenCenter 8.1.2进行安装即可,其中第一个为英文版,第二个为支持中文的版本。我们升级安装完XenCenter以后进行Citrix Hypervisor的管理。
升级完服务器虚拟化平台之后,之前安装的vGPU Manager(vGPU在Host端的驱动)已经不可用,所以需要重新安装新版本vGPU软件以支持Citrix Hypervisor 8.1的vGPU功能。我们可以先通过lspci查看物理GPU是否已经正常识别,下图显示当前物理GPU NVIDIA M60和P100已经被系统正常识别。
由于还没有为Citrix Hypervisor 8.1分配License,此时是无法进行任何类型的GPU分配给到虚拟机。之前的XenServer 7.2版本没有这么严格的限制,XenServer 7.2在没有分配License的时候,可以进行直通GPU的分配,但是不具备vGPU的分配能力。
获取Citrix Hypervisor测试License授权有两种方式,如上图所示:
1 申请单独的Citrix Hypervisor测试授权(如上图填写表单进行申请)
2 采用Citrix Virtual Apps and Desktop的测试授权
我们这里使用之前的Citrix Virtual Apps and Desktop License授权为Citrix Hypervisor进行授权,授权完成以后即可实现直通GPU的分配,如下图所示:
接下来我们需要安装vGPU Manger(10.1) 驱动在Host,安装以后Citrix Hypervisor 8.1就会具备vGPU的能力。
解压下载好的vGPU10.1安装包,其中1为host驱动(vGPU Manager),2为Windows虚拟机vGPU驱动,3为Linux虚拟机vGPU驱动
在Host上安装vGPU Manager,安装方法很简单只需要通过WINSCP把rmp安装包上传到Citrix Hypervisor然后执行如下命令安装即可。
安装:rpm -ivhNVIDIA-vGPU-xenserver-8.1-440.53.x86_64.rpm
验证:nvidia-smi,如果有正常输出则证明Host的vGPU Manager安装成功
重新启动服务器,以保证vGPU功能生效。重启以后我们再使用XenCenter对虚拟化平台进行连接管理,可以看到vGPU的功能以及可以正常使用。我在下图用红色框出的地方是多vGPU以及5K分辨率特性的支持。
最后我们要对分配了vGPU的虚拟机进行驱动升级,之前虚拟机内安装的vGPU6.1的驱动,所以Host的驱动变为10.1以后,此时vGPU的驱动也必须升级到10.x,否则无法使用,如下图红框所示(设备有黄色叹号):
上传vGPU的驱动到虚拟机内双击完成安装后重启生效。
最后我们需要确认下vGPU更新完驱动以后时候可以正常获取License。一般我们可以在License Web Console里查看。
如上图所示,升级后的vGPU正常获取到了License,至此我们完成了整个环境的升级操作。