
虚拟化实践及FAQ
文章平均质量分 74
汇集整理虚拟化技术相关文章,整理虚拟化工作运维记录,分享虚拟化技术应用实践
羌俊恩
工学文艺IT男,10年从事IT及项目管理相关工作,业余喜欢文字,视频剪辑,电气自动化和机械维修
展开
-
H3C CAS系列开篇之CAS初认识
基于信创需要,某项目中的VMware软件存求替代方案,尤其在VDI方面,寻求使用紫光集团旗下H3C的CAS云计算管理平台,又称CAS虚拟化解决方案/管理系统,H3C CAS是H3C公司面向数据中心自主研发的企业级虚拟化软件。CAS提供了强大的虚拟化功能和资源池管理能力,能有效整合数据中心IT基础设施资源,只需通过简单易用的管理界面轻松管理IT资源池和架构,助力数据中心从传统架构向云架构平滑演进。对硬件主机,CVM进行双击热备,两台服务器以主备模式运行CVM管理软件,通过虚拟IP来访问CAS管理平台。原创 2024-09-14 12:02:35 · 2196 阅读 · 0 评论 -
内核虚拟化技术:LXC
一、LXCLXC是LinuX Container的简称,提供轻量级的虚拟化,是一种基于容器的操作系统层级的虚拟化技术。利用新版Linux内核的特性(Cgroups等)实现的无需hypervisor的轻型虚拟化技术。容器能有效的将由单个操作系统管理的资源划分到孤立的组中,以更好地在孤立的组之间平衡有冲突的资源使用需求。LXC能够虚拟出一个完整的系统环境(rootfs),也可以仅为单个或多个应用程序提供虚拟化运行环境。从使用方式来看,它更像是增强版的chroot环境,提供一个拥有自己进程、网络空间的虚拟环境转载 2022-05-08 10:19:21 · 2137 阅读 · 1 评论 -
NSX-T架构及原理概述
一、概述NSX-T是VMware 的另一个 NSX 平台,NSX-T 与 VMware Photon 平台集成。VMware NSX-T 专注于处理异构endpoint和技术堆栈的新兴应用程序框架和架构的解决方案。除了 vSphere 管理程序之外,这些环境还可能包括其他 hypervisors、容器、裸机和公共云。NSX-T 提供分布式防火墙、逻辑交换和分布式路由。同NSX-V一样,NSX-T架构内置了独立的数据平面、控制平面和管理平面。二、架构NSX-T架构是围绕四个基本属性设计的。如上图原创 2022-04-11 19:56:53 · 7423 阅读 · 0 评论 -
vcenter中修改vm配置硬盘失败问题分析处理
一、问题描述某次一线反应,在修改vm的存储配置时,报错:A general system error occurred: PBM error occurred during PreReconfigureCallback: Fault cause: vmodl.fault.SystemError二、问题分析1)查看vcenter日志:vpxd.log三、问题处理四、附录:vcenter服务1)vCenter Server 7.x services:服务名称对应服务可视名称v原创 2022-03-18 19:21:55 · 3530 阅读 · 0 评论 -
Powershell对CSV文件中虚拟机批量开机
一、背景应VMware环境中问题处理人员咨询,需要对环境中异常vm进行批量开机操作,这些vm之前因环境网络问题,异常关机,相关vm信息已通过rvtool工具导出。对此,特编写以下脚本实现上述批处理vm的需求,脚本执行效果如下所示:二、脚本编写不足及优化之处还请路过的大佬指教!!!<# This is a poershell bat file which can batch start vm; author junn#># $TextUtf8 = New-Obje原创 2021-12-31 22:19:47 · 1095 阅读 · 8 评论 -
File system specific implementation of LookupAndOpen [file] failed
一、问题描述:某vm开机时,报错:文件系统特定的dOpen [file] 实施无效,无法启动虚拟机;“File system specific implementation of LookupAndOpen [file] failed。”二、分析处理1)可能原因:使用sesparse vmdk回收链接克隆的磁盘空间时数据损坏。/虚拟磁盘描述符文件(.vmdk,.vmx)中存在错误条目/ESXi主机与存储阵列之间的通信问题/ESXi操作系统问题/文件锁的问题/虚拟磁盘数据损坏原创 2021-12-29 21:37:45 · 5440 阅读 · 0 评论 -
UEFI虚拟桌面开启VT-X支持
一、背景描述因某虚拟桌面用户安卓模拟器使用要求,需要虚拟桌面支持VT-X;这是安卓模拟器软件安装所必须的;二、处理1)检查VM的配置项,在CPU配置处只有透传“硬件辅助虚拟化”到GuestOS里;2)VM现场所用OS为windows Server 2016,默认使用UEFI引导,其中没有“system配置”的选项,故不适用与在引导管理里开启VT-X:3)VM打开remote console,在CPU配置处可配置开启VT-x/AMD-V(需要关机):4)验证,打开夜神安卓模拟器,在【系统信息】里原创 2021-12-29 15:31:30 · 2506 阅读 · 1 评论 -
VMware中跨vCenter迁移虚拟机
一、场景描述在我们VMware环境中,多资源池,多vc管理是极大可能出现的,当我们有计划迁移某一vc虚拟vm资源到其他vc下时,少量时可采用导出导出的方式,但是大批量要怎样操作呢?这里介绍vmware技术社区的一款工具xvm,它作为VMware vSphere 6.0 及更高版本的新功能,可在 vCenter Server 实例之间实现跨vc的图形化批量迁移虚拟机操作,大大方便我们的vm迁移工作。二、相关软件软件下载:该实用程序允许用户使用跨 vCenter vMotion 功能从 vCenter 服原创 2021-12-06 12:08:45 · 5495 阅读 · 0 评论 -
Docker管理之碎片知识整理
一、概述本文旨在汇总整理Docker日常管理之知识碎片,以便日后回顾查看参考。二、应用示例2.1、Docker容器隔离之NamespaceNamespace:是容器虚拟化依赖的Linux 主要核心技术,用于各容器之间的隔离。主要通过以下六项隔离技术来实现:有两个伪文件系统:/proc和/sys/● UTS: 允许每个container拥有独立的hostname(主机名)和domainname(域名),使其在网络上可以被视作一个独立的节点而非Host上的一个进程。● IPC:contaner中原创 2021-11-25 19:57:01 · 1045 阅读 · 0 评论 -
关于VMware Tools is not running的问题分析思路
一、故障描述Horizon DAAS 云桌面用户反馈,某几个桌面最近一直出现Horizon client无法连接,重启好又可恢复/找运维人员处理使用一段时间后,故障现象复现,呈现断续好坏的问题,且过程中报错:vmware tools is not running。查看租户的Admin UI,发现用户事件里,确实有相关桌面故障报错:二、分析处理查看事件台有如下事件:2)可能原因:当C:\Program Files\VMware Tools和C:\ProgramData\VMw原创 2021-11-20 13:17:04 · 2155 阅读 · 1 评论 -
虚拟化技术知识总结
一、概览虚拟化是云计算系统中的一种基础技术,当前基本所有云计算服务都是构建在虚拟化所构造虚拟层基础上的。虚拟层将底层的传统硬件进行了整合甚至屏蔽,使上层的应用可透明的以为自己就是泡在真实的物理环境中,极大得提高了资源利用率和集成率,提升了管理效率和其他扩展的可能。虚拟化对底层资源的池化,应用相关人员可不再关注底层的硬件,可按需从池中消费资源,在计算机系统中,从底层至高层依次可分为:硬件层、操作系统层、函数库层、应用程序层,在对某层实施虚拟化时,该层和上一层之间的接口并不发生变化,而只变化该层的实现方式。从原创 2021-11-15 14:42:09 · 5252 阅读 · 0 评论 -
关于VMware环境中Duplicate IP的问题
一、问题描述在vmware环境中,经常会遇到vc或NSX报出Duplicate IP的问题,导致vm和edeg的网络问题,排查定位困难,今天我们就来看下如何处理这种重复IP的网络冲突问题。二、案例分析处理案例 1问题:A duplicate IP address is detected for a vmknic interface configuration. This impacts IPv4 and IPv6.If 192.168.3.1 is the IP address used by t原创 2021-10-29 18:40:34 · 2514 阅读 · 0 评论 -
使用控制台命令在 ESXi/ESX 主机上更改 VLAN ID
一、背景本文将记录如何在ESXi/ESX控制台使用命令修改虚拟交换机的 VLAN ID。二、修改过程1)登录esxi的控制台,查看虚拟交换机当前配置,执行:# esxcfg-vswitch -l,记住虚拟交换机的名称和端口组的名称,输出类似如下:Switch Name Num Ports Used Ports Configured Ports UplinksvSwitch0 32 4 32 vmnic0PortGroup Name Internal ID VL原创 2021-08-26 15:05:31 · 3508 阅读 · 0 评论 -
vCenter报错:部分主机上的 vDS配置与 vCenter的 vDS配置不同
一、问题描述vcenter平台事件台有警告事件,会看到一个黄色警告图标,提示:部分主机上的 vDS配置与 vCenter的 vDS配置不同,NSX-V的事件台也有类似事件。另“网络”视图中也会类似报错:The vSphere Distributed Switch configuration on some hosts differed from that of the vCenter Server.The vSphere Distributed Switch configuration on some翻译 2021-08-26 12:22:01 · 4735 阅读 · 0 评论 -
vDS报MTU支持状态和VLAN中继状态告警处理
一、故障描述某日,登录vc后,发现一批主机统一报分布式交换机 vlan中继状态和MTU状态告警,如下所示:查看事件台发现:二、故障分析处理1、vSphere Distributed Switch 运行状况检查可帮助确定和解决 vSphere Distributed Switch 中的配置错误,默认vSphere Distributed Switch 运行状况检查关于vlan和MTU的检查并未启用,当我们启用后,相关检测协议与外部交换机不一致,或检测结果与外联物理交换机配置不一致时,就会触发此类告原创 2021-08-26 10:05:01 · 6963 阅读 · 1 评论 -
vKernel Nic不正确配置告警处理
一、故障描述某次在对虚拟机vmotion,vcenter报vkernel 你猜未正确配置,事件台显示: VMkernel NIC (vmk#) is not configured correctly in the ESX advanced configuration option /Migrate/Vmknic;报错类似如下:The ESX advanced config option /Migrate/Vmknic is set to an invalid vmknic: vmk0. /Migrate原创 2021-08-07 12:27:10 · 1786 阅读 · 0 评论 -
vcenter报esxi主机 上行链路网络冗余丢失或网络冗余已降级
一、问题描述主机出现 “network redundancy lost” or "network redundancy degraded"告警。ESXi主机查看vmnic可能出现某端口状态为down,如非,报出冗余丢失消息,则可能是 NIC 抖动。有时在esxi的vobd日志看到:报 NIC Teaming(网卡成组)网络适配器失败且报出 failed criteria码提示的错误,类似如下:Nov 28 22:25:19 10.2.0.103 Nov 29 03:25:19 vobd: Nov 29原创 2021-08-02 20:54:25 · 8679 阅读 · 1 评论 -
ESXi处理主机错误无法进入维护模式
一、问题描述某Esxi主机因主机错误,手动关闭DRS后迁移虚拟机,发现某些虚拟机呈不可访问状态,主机进入维护模式失败处理1、将不可访问状态的vm记录,然后从清单移除,待主机恢复后,或存储里找到对应vm,在其他主机进行vm重新注册;2、Esxi主机使用命令行进入维护模式:1)进入维护模式:方法一:# vim-cmd /hostsvc/maintenance_mode_enter方法二:# esxcli system maintenanceMode set --enable yes方法三:# v原创 2021-07-27 16:03:01 · 7461 阅读 · 1 评论 -
NSX-V 安全之逻辑防火墙总结
一、概述传统的防火墙一般都是放在数据中心的出口处,控制数据中心对外的网络通信。边界防火墙(Perimeter Firewall)虽然能够很好地控制来自于外部的攻击风险,但是对于数据中心内部的黑客攻击却没有任何的防范措施。因此很多企业都采用零信任(Zero Trust)机制,假设安全威协无处不在,即使是在数据中心内部;企业自己的员工也是不可信任的,要尽量限制每个人需要访问的系统和数据。要为每个系统都配上防火墙,但是这样做成本很高,而软件形式的分布式防火墙可降低成本实现上述需求,同时也有助于提高东西向流量的原创 2021-07-25 23:41:39 · 1805 阅读 · 5 评论 -
NSX-V edge HA部署
一、背景因业务需要,将桌面接入流量分流至专用接口,从而多个租户都可走一个出口,而这将出现一个新问题,即该出口出现单点且威胁较大,影响所有租户业务流量。对此,需要对该出口边界edge设备进行HA部署。二、方案参考1)相关概念介绍:负载均衡(LB):将服务分摊到多个操作单元上执行从而共同完成工作任务。负载均衡既可以通过硬件来实现亦可以通过软件来实现,软件实现负载均衡的解决方案就是指在一台或多台服务器相应的操作系统上安装一个或多个附加软件来实现负载均衡,优点是配置简单,使用灵活。硬件负载均衡的解决方案是原创 2021-07-21 19:38:17 · 828 阅读 · 1 评论 -
NSX界面报VTEP IP is missing on the ESXi host
问题描述某次租户访问异常,在NSX vc子页面Logical Network Preparation > VXLAN Transport > Cluster & Host > Configuration处看到报错:Error:Some VTEP is missiong(not created) on the host;主机准备vxlan状态显示红色异常。处理1)查看主机准备所涉及集群各主机vtep配置(需手动点开),发现:如上所述,该报错是由于主机2的vtep异常所致原创 2021-07-21 16:13:17 · 703 阅读 · 4 评论 -
None of the NSX Edge VMs found in serving state
一、故障描述最近巡检过程中,多次发现vc事件台报如下错误,但实际并没有对相关虚拟机造成影响,故一直未处理,下面我们来看下该报错的原因:None of the NSX Edge VMs found in serving state. There is a possibility of network disruption.二、分析处理1)登录NSX_manager UI页面,下载tech log日志;2)查看None of the NSX Edge ……信息上下文,找到相关的对象的vm-id;示原创 2021-07-19 21:12:15 · 295 阅读 · 0 评论 -
VMware环境vm开启时报错无法连接到DVS,dvs端口不可用
一、故障描述某次巡检人员发现,很多vm处于死机状态,手动执行开机/power on操作,无法完成开机操作,报错:Network interface ‘Network adapter 1’ uses network ‘Distributed Virtual Switch (uuid: )’, which is not accessible检查事件台,发现vm开机会触发自动迁移,且迁移失败导致了vm无法开机,报错如下:环境:每主机上都配置有VSS,且vmotion配置在其上的管理vkernel上。故不原创 2021-07-19 12:24:06 · 1846 阅读 · 4 评论 -
VMware内存资源管理理解
在虚拟化应用中,内存是最为宝贵的资源。同CPU和存储资源管理相比,虚拟化的内存资源管理更为复杂。 内存回收vmware ESX hypervisor(管理程序)能够截获虚拟机第一次访问某内存,将物理内存填零后分配给虚拟机,但是hypervisor无法得知虚拟机中哪些内存是空闲的。 hypervisor不断的将内存分配给虚拟机,当在内存超配(memory overcommitment)的情况下主机物理内存将可能耗尽,因此hypervisor需要从虚拟机中回收(reclaim)内存,ESX hype原创 2021-07-08 21:45:21 · 2487 阅读 · 0 评论 -
OVF 和 OVA 文件格式和模板的区别
概要在vSphere环境里,我们会经常遇到利用OVF或OVA部署虚拟设备,或将虚拟设备导出为OVF或OVA模板,进行迁移;说明wom可以通过 OVF 文件格式在不同产品和平台之间交换虚拟设备。在将虚拟机导出为 OVF 文件时,您可以创建一个目录来存放 OVF 文件和虚拟磁盘文件。您可能会将 OVF 视为此 OVF 目录中所有文件的存档。OVA 是为同一 OVF 文件包创建的一个文件分发。OVF 和 OVA 格式具有以下优势:1)OVF 和 OVA 文件为压缩格式,下载速度更快。2)vSphere原创 2021-06-25 11:30:21 · 7436 阅读 · 1 评论 -
ESXi虚拟化网络故障排查指导手册
背景我们在使用vsphere产品中会经常遇到一些网络问题,本文收集整理了一些相关排查资料,梳理了排查的思路,以供参考排查指导1、ESXi主机本地虚拟网卡状态:命令: esxcli network nic list //显示esxi主机当前个网口状态及链路状态2、ESXi主机分布式交换机信息:命令:net-dvs上述命令显示有关VMware分布式dvSwtich配置的所有信息。net-dvs命令从/etc/vmware/dvsdata.db文件中读取信息并显示控制台中的所有数据。vSphe原创 2021-06-21 11:45:41 · 1344 阅读 · 0 评论 -
Docker容器回顾之运维篇
背景接上一篇《Docker复习之部署篇》,本文继续对Docker之日常维护常用操作做回顾总结。操作命令2.1 Docker 容器查看首先,管理员对docker做日常维护,需要了解现有环境有多少docker实例,并连接进入docker实例虚拟机进行对应的管理维护;我们执行 docker ps 命令来查看容器名称:docker ps -a或docker ps //显示当前正在运行的容器,输出如下:参数概览:示例:1)显示最后被创建的容器:docker ps -l //相当于 dock原创 2021-05-31 16:02:21 · 2040 阅读 · 2 评论 -
Horizon 云桌面内网通信异常处理
一、问题描述前方反映某用户部分云桌面无法连接,检查租户管理平台,显示agent状态为unknown;手动对异常桌面进行代理配对重置,未果,无法完成。二、检查分析1)登录其中某一故障桌面,检查网络发现,ping本地网络不通,ping本机网卡报:一般故障;上述可能原因:1>防火墙问题:检查分布式防火墙,检查本机防火墙,检查主机防火墙,关停后验证,皆未果;(实际验证本机防火墙就行,因本机ip就不通):A:入站未放通ICMP会导致ping不通外部服务器(请求超时)B:出站未放通ICMP会导致原创 2021-05-26 19:00:36 · 991 阅读 · 0 评论 -
Service center报Error while retrieveing hander result for HAL故障处理
问题描述SP门户可以正常访问,但是租户设备和rm,sp设备无法重置处理,报:Error while retrieveing hander result for HAL;SP门户界面,为租户分配computer resource资源时,加载一段时间后报错,无法成功进行资源分配,租户无法发布交付;分析处理1)查看SP主设备slony和desktone日志,发现状态异常;...原创 2021-05-24 21:22:49 · 658 阅读 · 2 评论 -
ESXi主机vSphere CLI常用命令
概览vSphere CLI中,注意到很多命令已更名为vicfg,而不是esxcfg -(即esxcfg - nics.pl和vicfg - nics.pl)。两个命令都执行相同的功能,但VMware试图从esxcfg迁移到vicfg。工具命令1)vmkfstools工具它一般又称为虚拟磁盘中的瑞士军刀,可用于复制、转换、重命名、输入、输出和调整虚拟磁盘文件的大小。vmkfstools用于管理 VMFS 卷、存储设备和虚拟磁盘。可以使用 vmkfstools 命令执行很多存储操作。例如,可以在物理分原创 2021-05-21 19:24:09 · 821 阅读 · 0 评论 -
关于rmdisk ‘vsanstraces’ is full导致esxi主机错误的问题
一、问题描述某次发布view桌面,前方反映,桌面发布失败报错找不到NSX,检查对应集群,发现某台主机报:主机错误,其余vsan集群中其他主机通信异常;查看日志,报:ramdisk ‘vsanstore’已满,无法写入文件;二、分析处理1)从告警信息直观看,ramdisk空间不足/已经占满,导致报出如上错误;2)登录故障主机远程管理,...原创 2021-05-20 12:00:47 · 662 阅读 · 0 评论 -
ESXi主机退出维护模式后HA可用性状态:无法访问处理
原因:vSphere HA 代理可能因多个原因而处于代理无法访问状况。这种情况通常表示网络连接问题正在阻止 vCenter Server 访问首选主机和主机上的代理,或表示群集中的所有主机都失败。这种情况还可能表示一种不太可能的情况:vSphere HA 已被禁用并已在群集中重新启用但 vCenter Server 无法与主机上的 vSphere HA 代理通信,或主机上的代理已失败且监视程序进程无法将其重新启动。解决方案:确定 vCenter Server 是否报告主机无响应。如果是,则说明存在网络..原创 2021-04-29 21:04:12 · 1953 阅读 · 0 评论 -
VSAN数据存储存储没有容量(vsan容量大小变为0)问题处理
一、问题描述迁移一台主机到某VSAN集群下后,未关联DVS和配置配置vkernel,就误操作退出维护模式,导致vsan存储集群监测报错,如下所示:其他相关报错:二、分析处理1)VSAN与vsphere HA的关系:一般实际使用场景,会为vSAN 配置使用其自身的专用逻辑网络。当为同一群集启用 vSAN和 vSphere HA 时,HA 代理间流量将通过此存储网络,而非管理网络。VMware 希望在发生网络故障时 HA 和 VSAN 节点属于同一个分区;这样就可以避免因 HA 和原创 2021-04-28 00:04:24 · 4152 阅读 · 0 评论 -
ESXi主机vxlan网络无法访问外网处理
问题描述分析处理1、登录主机,ping测试业务vmkernel网络:如上图所示,起到业务网络的网关通,而到其他同网络下的主机不通;继续ping测试,到114和业务外网上联端口也不通;2、查看路由:3、...原创 2021-04-19 13:14:36 · 3071 阅读 · 0 评论 -
Horizon Daas SP为租户分配资源池失败处理
问题描述某次在为新建租户分配资源池时,可以正常弹出资源池列表窗口,设置好特定的cpu,ram容量后,点击分配,报错:分配未成功,如下所示:未解决分析处理1)为租户分配资源池,可正常弹出资源池列表,说明资源池信息读取正常,而分配失败,即表明本次出错在分配流程环节。2)登录SP设备服务器,查看desktone日志发现:3)SP-master查看日志发现:无端口监听。4)我们重启daas服务看下:查看端口及日志:日志正常5)尝试重新分配资源,依然报失败:原创 2021-04-19 11:25:29 · 285 阅读 · 0 评论 -
VSAN集群报错:未知对象类型 不可访问 处理
问题描述某次巡检发下,VSAN集群中,某主机报:主机错误;结果至于维护模式过程中,vm迁移错误;查看集群VSAN磁盘状态,发现其他主机上vm对象正常,只其中一台主机报错:未知对象类型 不可访问,如下:而且,故障主机上跑着有vm,迁移vm时报错:问题分析1)检查不可访问的虚拟对象,发现这些对象并非在14主机的单一磁盘组里:附录:VSAN对象运行不正常时可能具有的几种状态1)数据移动:vSAN 将在集群中的 ESXi 主机和存储上构建数据,当将VSAN集群中主机置于维护模式时,因为已请原创 2021-04-13 12:29:18 · 3271 阅读 · 2 评论 -
VSAN集群报配置错误处理
问题描述巡检发现,某几区报vsan错误,如下:分析处理1)由报错图示可知,7主机上配置的vmkernel适配器(用于VSAN流量)的IP地址与57主机上的vmkernel地址冲突,根据提示检查MAC地址,确认,当前哪个主机占用该ip地址。其中,7主机的vmk2的MAC地址为:而57主机的vmk2的mac地址为:与告警所报占用ip地址的网卡mac匹配;因此重新对主机7的vmk2进行重新配置网络2)集群中其他主机的vmk2地址全部修正,后开启HA,查看状态。...原创 2021-04-12 15:59:05 · 1683 阅读 · 0 评论 -
VMware 虚拟化知识导图
原创 2021-04-10 12:43:57 · 453 阅读 · 0 评论 -
vsphere vsan闪存盘故障处理
问题描述巡检发现,某主机的vsan磁盘组中闪存盘故障,如下:处理:1)登录管理console,检查该主机是否有硬件报错:2)如上确定是硬件故障,则将该磁盘组移除,数据迁移到其他磁盘:预检查2数据迁移,系统报无法迁移3)将主机置于维护模式:4)联系主机运维人员,报故障处理。...原创 2021-04-06 17:44:46 · 3079 阅读 · 0 评论 -
关于esxi主机上vm无法ping通edge网关设备ip的处理
问题描述某次Horizon Daas 租户环境部署,发现在资源池某台主机上的vm与edge设备上的网关地址无法连通,租户网络异常,迁移vm到其他主机后网络连通正常。故障原由难以判断,本文特此分析,以作记录。问题分析1、将同一个租户网络内的两台vm分别布置在两台不同的esxi主机上;两台vm之间网络ping正常;2、将其中一台vm迁移到esxi1主机上,该vm与其他主机同网络的vm通信正常,但该vm服务器ping edge设备的下联端口(即租户内网网关ip)无法ping通,显示目标网络不可达;3、将原创 2021-03-31 18:57:51 · 2208 阅读 · 0 评论