双系统下win10安装第二个版本的cuda因为默认安装引起的系统重启失败崩溃和解决之路

一、问题描述

        3.8号中午1点多,我准备在win10系统下安装第二个版本的cuda,以支持PyTorch1.2 GPU版本的顺利运行。原来的cuda版本是9.0,现在需要安装9.2的。简单搜了两篇博客,尤其其中一篇:https://blog.csdn.net/zsc201825/article/details/91149550,给我带来了很大的误导。。。。。当时看完觉得没什么要特别注意的地方,就下载了cuda然后一路默认安装了下去,安装完毕提示重启系统生效,然而在重启系统时,出现了大问题:显示系统存在问题,之后启动自动修复,然后失败。如下图:

 对问题背景的补充:我的机器的基本情况

我的笔记本是256G固态+1T机械的双硬盘配置,分区情况如下:

Windows系统分了4个区,系统盘在固态上,D,E,F三个盘在机械上;

Ubuntu系统也是分了四部分(Linux文件系统叫分区可能不太准确?)其中Boot部分在固态上,分了2G的空间,当时是因为看到教程说这样Ubuntu的启动可以加快,剩下的3个区包括不知道有啥用的swap区都在机械硬盘上,分了200G吧。

固态上当然还有windows reserve区,Win系统恢复区,以及EFI文件区。

二、问题解决的初期阶段

进入高级选项一番操作,还是不行,当时的尝试有:

1、卸载最新的质量更新:这是针对驱动、补丁的更新 ,卸载了一次重启发现还是不行,就又卸载了一次,依旧崩。

2、因为我没有保存过系统的恢复节点,所以一些系统恢复到上一个节点之类的功能也用不了,在点了上图的高级选项的页面如下:

 疑难解答中有两个选项:1-重置电脑,2-高级选项:就是在这个里面卸载最近的更新(包括质量更新、功能更新),恢复到系统的上一个节点(应该是需要保存过系统的节点)等功能,我的电脑是有7个选项,然而都不行。所以我选择重置:

 我是非常不想重置电脑的:因为一旦重置了,应用和个人设置都没了,还要花上大半天的时间乃至一两天把所有软件装回来。费时费力。但是当时除此之外也别无他法,选择了第一项进行重置,然而重置了两次都是到46%的时候突然退出了重置。因此这条路也行不通了。

三、问题解决的困难期

       经过上面的尝试发现无法恢复,我开始慌了,最近的学习压力还是很重的,生产力工具不能用可怎么办??而且更重要的是,我开始担心数据丢失问题。问了同学之后,觉得还是要先备份一下文件,从固态硬盘、usb(UEFI)、ubuntu启动进去备份都可以,u盘和固态应该要先做启动盘(这里,固态我不太确定),我的电脑因为安装了双系统,从关机再从Ubuntu进入就可以,然后备份文件。

3.1 备份文件:

一般来说,正常情况,即使重装系统也只会影响系统盘,文件盘是没问题的,但是双硬盘双系统下我实在担心,文件盘的重要资料好多没有备份。于是用移动硬盘开始备份文件盘的资料,以及系统盘的一些个人设置(比如桌面,等等),但是机械移动硬盘拷贝文件好像有一个缓存区的概念(这里还不太清楚和Ubuntu系统有没有关系),拷贝速度在大文件量传输下掉的很快(直到最后也没实现全部备份)。由此也体现了平时定期备份重要工作文件,以及用OneDrive备份的重要性。

3.2 从命令行卸载可能存在问题的驱动安装:

到这一步经过搜索已经基本明白问题可能的原因所在了:在安装第二个版本的cuda时默认安装会把显卡驱动也安装了,然而我的电脑本来就有英伟达的显卡驱动。搜索了一下,正常来说,后一个驱动会覆盖前一个驱动(这里还不太确定是不是都能覆盖,但是后来恢复了确实发现原来的驱动版本被覆盖掉了)应该也不会出问题,但是我的电脑偏偏就在重新启动时出现了问题。

于是参考同学提供的Ubuntu出现可能类似问题时的办法,进不了GUI界面但可以进去bash,命令行卸载旧驱动装了新的就好了。我在启动遇到问题时也有命令行恢复的选项,就在那7个选项的页面。然而在win下操作命令行卸载驱动实在是太不熟悉,一时间也没有找到(其实也没仔细找)相关的操作教程(要是有个win运维大佬在身边就好了。。)

之后请教了另外一位同学,开始新的解决途径:安全模式,不行就在C盘格式化重装系统。

3.3 安全模式

这次的故障让我这个没怎么遇到过win故障的小白临阵磨枪了解到了不少新知识。安全模式说实话我之前从来没接触过,这次简单查了一下:安全模式的工作原理是在不加载第三方设备驱动程序的情况下启动电脑,使电脑运行在系统最小模式,这样用户就可以方便地检测与修复计算机系统的错误。(引自百度百科词条)。讲道理如果是英伟达驱动引起的问题,进入安全模式之后应该就可以卸载,重装就OK的。但是:安全模式依旧进不去。(从最后的找到的浅层原因来看,此时的安全模式当然应该进不去)

进安全模式,卸载重装问题驱动又走不通了。这时候已经从下午1点半问题出现折腾到了4点了。

3.4 重装系统的初步尝试

因为双系统,重装系统害怕出别的问题。在谷歌搜了一下,以及问了下同学,他双win的系统重装是没有问题的,只是只有一个系统是快速引导启动。我开始着手看一些双系统重装教程,以及win重装的教程。同时又充上了欠费几个月的校园网,从校园网下载专业版win10镜像。等等。

期间问了另外一个本科时经常帮助别人解决各种疑难杂症的大佬,他的解决问题的思路也是值得单独学习的。首先三连问:

启动不了还是屏幕不显示?启动不了。

进安全模式或者pe能进去吗?安全模式进不去(此时我还不懂pe是啥)

这次出问题前后有没有改过BIOS?最近都没改过(这第3个问题很关键。。)

之后因为重置失败,他给出了2个建议:

1、从Ubuntu进去把C盘下的显卡的注册表和驱动删了,集显的也删除了(删集成显卡驱动不知道为啥)。这个和命令行卸载重装驱动有些类似。但是我按网上说的找到了文件夹下面却找不到英伟达的显卡驱动(应该是Ubuntu系统下win的一些系统文件不可见吧,此处存疑),这一点就不可行了。

2、在Linux里面把C盘重要的文件拷贝出来重装系统。还提醒注意不要把Ubuntu也搞坏,就是按照直接替换现在的Windows盘符下的系统文件的思路来重装。就是只动win的C盘,格盘重装。

四、重装系统的坎坷

4.1 关于U盘启动盘制作的几个疑问和解答

1、Linux下做得U盘启动盘,不会有问题吧?

理论上U盘启动盘跟什么系统做的没啥关系,只和才去的方式有关:直接镜像做的,还是pe做得。

用镜像直接做的工具:软碟通(我当时做双系统的Ubuntu的启动盘用的是这个),Rufus(一个很棒的开源纯净版工具),以及Win自带的工具。这篇知乎文章提到了后两种的做法,软碟通和他们差不多。

用pe系统+镜像的方式,在u盘做pe系统:pe系统是:Windows Preinstallation Environment(Windows PE),Windows预安装环境,是带有有限服务的最小Win32子系统,基于以保护模式运行的Windows XP Professional及以上内核。它包括运行Windows安装程序及脚本、连接网络共享、自动化基本过程以及执行硬件验证所需的最小功能。工具有耳熟能详的老毛桃,大白菜,还有微PE工具箱。

以上的几个工具,我在这次重装中几乎都用到了,还不止一遍。然而都出现了问题。。。当然绝大多数情况应该是没问题的,我这属于极少数情况。

4.2 制作U盘启动盘的艰辛

正常情况下u盘启动盘制作、从启动盘安装系统,并不算复杂,正常的话1小时或者更短时间就应该能搞好了(在有现成系统镜像的情况下)。但是偏偏屋漏偏逢连夜雨,我这次制作U盘启动盘+重装确实异常艰辛,从8号下午接近晚上开始,搞到第二天下午4-5点,基本上能遇到的不能遇到的意外都遇到了。。。

1、第一个麻烦,镜像文件太大与U盘拷贝的问题

我的第一想法还是,用最熟悉的软碟通做,需要在手头上另一台win8的台式机上做。

镜像有5个G,而正常u盘的默认文件区管理方式是FAT32,单独文件最大允许4G文件的移动。为此不得不把U盘格式化为NTFS,将Ubuntu里下载的拷到台式机上。用软碟通制作启动盘也必须使用NTFS的格式,因为install.wim单文件就大于4G。然而这样做出来的启动盘却根本不能用,大小只有不到1G。

 经过前面漫长的备份文件,实在等不及用这个启动盘试了一下,直接GG,如上图,开机按F9选择启动位置,能看到U盘但是显示未验证过的。(我猜想这里的原因是:install.wim没有写进去,可能还是跟NTFS和FAT32的格式有关因此不到5G的镜像最后只剩下了1G,原因还待商榷)

2、在折腾软碟通多次制作启动盘尝试的时候,我也在尝试在Ubuntu上制作启动盘,woeusb

Ubuntu制作启动盘最终失败了。采用woeusb制作,第一天晚上是因为umount u盘用错了符号,每次umount的是磁盘名称sdb,虽然b站上视频教程以及另一个教程:Linux公社的文章,也是用的卸载盘名,但我这里后来尝试umount分区名,然后就过了这一关。第二天老毛桃一直无效,本来想拿出woeusb作为一张保底牌,没成想在我的机器上做的过程实在太缓慢了,最后放弃。

3、第一天晚上还尝试了第3种方案:老毛桃

软碟通做的启动盘出问题,linux做启动盘报错直到第一天夜里1点才发现是umount错了对象,然而老毛桃做pe系统也出问题了。做好的pe系统无法模拟启动到对应的界面,我同学也没遇到过这种问题。(这里我只能怀疑是安装了假的老毛桃?or 我u盘的问题??)而且往里面拷贝镜像文件慢到令人发指。。于是放弃。。

4、第二天白天的尝试(结果就是2中说的那样)

前一天发现的软碟通、老毛桃两种方法行不通。我决定头铁在linux上做启动盘,先把ubuntu终端 fq 的设置确认了一下,以防止出现昨晚睡前github下载巨慢的情况。然而下载速度还不是很快(应该还要在设置一下),最后下载下来后续执行的也巨慢,退出放弃。

5、知乎上的搜索 + 转向使用纯净的启动盘工具

在知乎上看到了一些不错的回答:https://www.zhihu.com/question/323397175/answer/691829580

尝试了微PE做PE系统第一次没有成功,之后就没在琢磨问题出在哪里,放弃了,改用其他。

老毛桃、大白菜之类的诟病太多,连官网都不一定是真的,也不想用了,改向官方的工具,直接把镜像做进u盘里。

微软官方的制作u盘启动盘的工具很好用,只不过不支持从现有的镜像制作,知乎上还问了轮子哥,得到这个回复之后Pass掉了这个方法。

之后又使用了Windows 7 USB/DVD Download Tool,是官方的另外一个工具,结果报了另外一个错误:The Selected File Is Not A Valid ISO File,如此链接所述:https://www.intowindows.com/fix-the-selected-file-is-not-a-valid-iso-file-error-in-windows-7-usbdvd-download-tool/

最后在上面的链接里,以及知乎上的回答,让我决定用Rufus来做启动盘,这也是我尝试的最后一种方法。

6、Rufus

这个制作工具是很好的,纯净、快速,能解决iso过大的问题。也找到了合适的教程跟着做。

首先,选择了GPT+UEFI的格式制作的,需要禁用安全模式,我还按照惠普电脑官网的关闭安全模式的教程把传统支持也打开了。之后用常规版和protable版各试了一遍都不行,可以进去,但是:

出现的这样的问题,只能找到rufus的github issue里提到过一次这个错误,还是因为人家镜像有问题。我这里实在不知道是不是镜像的问题。。因为我镜像从学校官网下载的。

之后试了mbr+bios(或uefi+csm)格式制作的启动盘,终于才可以进去了安装界面,但是安装一开始检测到驱动有问题,同学建议是USB3.0的驱动的问题,换2.0U盘做或者下载一个驱动加进去。从网上看了下,发现大多数的说法是最新版的系统镜像做出来的一般不会有这种问题的。

先用USB2.0做好了一个,但是拔的时候SB了,没有弹出DVD驱动分区(U盘内部的)直接弹出了U盘,之后担心有问题决定再做一遍,发现过程奇慢无比,最后几乎搞报废了一个U盘。

之后只有试一试加驱动了,从惠普官网找了下,不知道下那个版本号的合适,就下了WIN10(64bit)不带任何日期后缀的,放到启动盘,安装时:扫描了一遍发现都不兼容。。。

无奈,听同学的建议决定还是用PE来安装,解决办法多些。当时甚至都想用微软官方的工具直接下载制作1-2小时应该也做好了。

然而转折发生在我退出安装程序重启的时候,顺手想再试试Win能不能修复,就没有惯例进Ubuntu搜解决方案什么的。

结果发现:

五、峰回路转,Win10系统成功进入

win10进入,还是熟悉的桌面,连之前未关闭的页面都还在。打开IE会自动弹出之前读的论文PDF。。。

最后分析的原因应该是:

Win10系统的UEFI引导损坏,不能正确引导;Ubuntu当初是在装完Win10的基础上在装的,选系统界面grub没受到影响,Ubuntu能正确启动。而因为折腾Rufus安装时关闭了安全模式+开启传统模式支持。最后win10从uefi-csm兼容的方式(或者是传统的BIOS启动?)成功启动了。而且据说,Win7升级Win10的电脑都是这种启动方式,因此这样做是没问题的,只是可能会慢几秒钟。

让人还是不太明白的是:装第二个版本的cuda,默认重装了一次NVIDIA显卡驱动,怎么就会损坏UEFI对Win10启动引导呢??

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值