前几天,上海浦东某机房新采购一批节点服务器,这一批运算服务器系华为品牌,基本配置为:
CPU:Intel Xeon 2680V4 二块
显卡:Tesla K40 十块
内存:512G
整体配置相对高端,运算性能强悍不容置疑。由于疫情的影响,我受公司委托,协此相关IT技术和代理技术工程师,对这批运算服务器的前期CentOS操作系统的安装。
一、【部署思维】
根据金牌代理商的建议,我们拟采用网线连接管理端口,通过Huawei IBMC进行CentOS的安装。前期准备工作如下:
- 1、 设定笔记本电脑的IP地址为: 192.168.2.xxx;
- 2、 连接网线N条;
- 3、 CentOS 7的ISO包;
- 4、 笔记本安装JAVA环境(JRE 8);
物理把网线正确连接在华为服务器的BMC网络管理端口,使用浏览器打地址:192.168.2.100(初始默认地址,建议修改提升安全管理等级!
华为iBMC登陆界面
华为服务器的IBMC管理和配置,我会在下一篇给大家详细介绍一下,IBMC纯图形界面的配置,如果思路明确,操作并不难!
二、【疑难杂症】
在CentOS7的安装过程中,不过我们用U盘启动,还是通过IBMC使用CentOS ISO包虚拟光拟安装,都无法进入到正常的图像安装界面……。现在具有丰富经验的华为代理商IT技术工程师,有点一头雾水:更换U盘,检查各种iBMC配置,更换到其他几台服务器,操作均类似!
当时我作为一名协助技术工程师,尤其对于华为服务器也是初次部署,当时的我属于旁边学习者的身份:只能看着大家着急。
时间一分一秒,眼看上午就卡在这个步骤。项目负责人突然想起之前也碰到过类似的问题,发给我这样一张处理图片,如下:
项目负责人的提示
根据图片内容提示,第一种方法我们直接放弃:十块Tesla K40图像运算卡的拔插操作,风险系数高,尤其对于刚上好机架的服务器工作量大。
我们一致确认采用第二种方式,为了找到第二种正确的操作方法。我使用电脑连接了其中某台华为服务器,开始进行了尝试性操作。
我平时工作在生产环境,安装部署Linux操作系统并不多见,尤其是一些专业词汇不理解。例如:grub编辑,kernel所在行等等。只能根据负责人给我的操作方法,反复尝试,最好我们终于模索出正确的操作方法,如下图:
“grub编辑”和“kernel所在行”图解
这是服务器配置的Tesla K40运算显卡对CentOS 7不兼容造成的故障,我们熟悉相关概念和操作后,在安装开始界面,通过以下操作:
- 1、 光标停留在 “Install CentOS 7”;
- 2、 按键盘“Tab”键,进行grub编辑模式;
- 3、 最下面的kernel所在行“>vmlinuz initrd=initrd.img inst.stage2=hd:LABEL=CentOSX207x20x86_64 quiet nouveau.modeset=0
- 4、 回车继续开始,CentOS熟悉的安装界面终于出来了!
后续的安装,相对简单,大家可以用VMware Workstation等虚拟机摸拟安装学习。
三、【故障小结】
公司成立以来一致专注小微企业的IT运行和维护,基本上没有接触过这类中高端的服务器生产环境,相对这一块来说:比较陌生,但我们的工程师具有20多年丰富的现场工作经验!
在服务器安装和部署过程中,碰到过很多疑难杂症,遇到问题先不要放弃,我们可以通过网络查询相关故障提示、报错信息和关健字,借签相关网友(大神)的成功处理经验,慢慢分析故障原因、找到故障点并解决难点,更好的完成工作!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。