1. Ubuntu安装
step 1: 制作启动盘+硬盘分区,具体不再详述,可见这篇文章:链接
step 2: 将启动盘插好,重启电脑,在开机界面按F2进入BIOS界面,然后按F8,选择启动U盘并按回车(不同的品牌启动快捷键不太一样,根据自己的主板品牌自行选择)
参考下面文章安装系统:链接
分区方案1:
当采用上述方案时,即
/ --> 150G-200G --> 主分区 --> 起始位置 -->
分区方案2:
安装时如果遇到关于boot的错误提示框,使用如下方法解决:
win 10 U盘启动安装ubuntu遇到的问题和解决方式
预装win8的电脑上U盘安装ubuntu出现了问题
2.重装ubuntu链接
1.此电脑->管理->磁盘管理,删除Ubuntu所在的磁盘分区,注意不要删除引导盘
2.删除Ubuntu启动项:
首先下载EasyUEFI,下载链接,选择Free Trial;
安装该软件并打开->管理EFI启动项->在左侧栏中选择Ubuntu,然后点击中间第三个带红点的按钮(delete)->确认删除。
3.设置Windows为默认启动项:
下载并安装EasyBCD,easyBCD下载地址;
点击BCD部署,选择分区为Windows的C盘(C:\作为NTFS-xxxG)-> 然后点击带感叹号的编写MBR;
点击左侧编辑引导菜单,点击Window10,并将其上移到第一个并保存设置;
重启,看再开机是否直接启动win10。
4.根据正常流程安装ubuntu。
3.关闭ubuntu内核更新
软件和更新->更新->自动检查更新:从不 & 当有安全更新时:立即显示 & 当有其他更新时:立即显示
4.更新软件源
1)备份源文件
- sudo cp /etc/apt/sources.list /etc/apt/sources.list.bat
复制代码
2)编辑sources.list文件
- sudo gedit /etc/apt/sources.list
复制代码
3)将如下内容复制到上述文件中,并注释之前的内容(参考博客)
- deb https://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
- deb-src https://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
- deb https://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
- deb-src https://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
- deb https://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
- deb-src https://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
- # deb https://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
- # deb-src https://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
- deb https://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
- deb-src https://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
复制代码
4)更新软件源列表
5)更新软件包
5.更新pip源
1)在/home下新建.pip文件夹
2)在.pip文件夹下新建pip.conf文件
3)在pip.conf文件内添加清华源
- [global]
- index-url = https://pypi.tuna.tsinghua.edu.cn/simple
- [install]
- trusted-host = https://pypi.tuna.tsinghua.edu.cn
复制代码
6.若安装完Ubuntu系统,无有线网和无线网驱动
可能是系统内核太老,不支持较新的网卡驱动,此时可以安装 HWE (Hardware Enablement) 内核(支持更新的硬件)
- sudo apt update
- sudo apt install --install-recommends linux-generic-hwe-20.04
- sudo reboot
复制代码
7.以管理员Root身份用可视化方式打开根目录文件夹
8.清理ubuntu缓存目录
- sudo rm -rf ~/.cache/pip
- sudo apt-get autoclean
- sudo apt-get clean
- sudo apt-get autoremove
复制代码
9.Ubuntu引导项修复
方法1:
在 Windows 搜索栏输入 cmd,右键选择「以管理员身份运行」。
执行命令 bcdedit /set {bootmgr} path \EFI\ubuntu\grubx64.efi
若无效,尝试替换为shimx64.efi(支持Secure Boot)
方法2:
1.插入启动盘,开机时按F8(华硕主板F8, 技嘉主板F12,Intel主板F18,联想笔记本F12,微星主板F11),磁盘启动,选择try ubuntu (记得用英文界面,中文界面会出现许多奇怪问题)
2.使用免驱的无线网卡或者有线网连入网络
3.打开终端,输入
- sudo add-apt-repository ppa:yannubuntu/boot-repair
- sudo apt-get update
- sudo apt-get install -y boot-repair
复制代码
4.安装成功之后,启动boot-repair
5.点击“Recommended repair (repairs most frequent problems)”按钮即可进行修复
p.s. 如果没有这个按钮,多试几次即可
方法3:
1.开机时快速按F2/Del/F12(具体按键因主板而异)进入UEFI设置
2.找到"Boot"或“Startup”选项卡
3.在启动优先级列表中,将“Ubuntu”或者“UEFI OS”项提升至“Windows Boot Manager”之上
4.按F10保存退出,系统将自动进入GRUB引导菜单
方法4:
使用EasyUEFI修复,参考链接
方法5:
使用U盘安装GRUB,参考链接1,链接2.
10./home扩容
Ubuntu-home扩容
11.双系统安装出现grub(GNN GRUB Version 2.02或者2.04)
解决方法:直接在grub后面输入exit
12.安装独立显卡驱动
方法1:
1)查看显卡硬件型号
比如我的电脑是Geforce RTX 2060显卡,推荐安装nvidia-driver-460 -distro non-free recommended
2)安装
自动安装:
- sudo ubuntu-drivers autoinstall
复制代码
或手动安装:
- sudo apt install nvidia-driver-460
复制代码
如果遇到报错:
首先安装依赖:
然后执行原来的指令:
- sudo apt install nvidia-driver-460
复制代码
安装完之后重启即可
方法2:原文章
step 1: 禁用系统自带的nouveau驱动
a.查看系统是否启用了nouveau显卡驱动
运行如下指令:
如果有内容输出,则说明nouveau已被启用,需要执行后续从b.开始的步骤以将nouveau禁用;
如果没有内容输出,则可以直接安装nvidia驱动。
b.修改blacklist.conf配置
- cd ../../etc/modprobe.d
- sudo gedit blacklist.conf
复制代码
在文件最后插入以下两行内容:
- blacklist nouveau
- options nouveau modeset=0
复制代码
保存并关闭该文件
通过以下命令更新系统,并使刚刚修改的文件生效:
重启系统
c.再次验证nouveau是否已经禁用
再次输入如下命令,如果没有输出,则证明nouveau显卡驱动已经被禁用,此时可以安装nvidia显卡驱动。
step 2:下载Nvidia显卡驱动
官网链接
下载好的驱动文件名称为:NVIDIA-Linux-x86_64-535.xxx.xx.run
接下来通过如下命令获取该.run文件的执行权限:
- chmod +x NVIDIA-Linux-x86_64-535.xxx.xx.run
复制代码
step 3: 安装GCC和CMAKE
显卡驱动的编译需要c++环境,安装一下GCC和CMAKE
- sudo apt-get update
- sudo apt-get install gcc
- sudo apt install cmake
复制代码
step 4: 关闭图形界面(实际操作中发现不关闭也没事)
- sudo systemctl stop gdm # 适用于 GNOME(Ubuntu 默认)
- # 或
- sudo systemctl stop lightdm # 适用于 Xfce/LightDM
复制代码
然后按 Ctrl+Alt+F2 切换到 TTY 终端(如 F2-F6)
step 5: 安装Nvidia驱动
通过如下命令运行./run文件
- sudo ./NVIDIA-Linux-x86_64-535.xxx.xx.run
复制代码
按照默认步骤进行即可,安装完后输入sudo reboot重启电脑。
13.系统更新内核后显卡驱动崩溃的修复
step 1: 若图形界面崩溃,按 Ctrl+Alt+F2 进入 TTY 命令行
step 2: 卸载旧驱动
- sudo apt purge nvidia-* # 清除所有旧驱动
复制代码
step 3: 安装新驱动
自动安装:
- sudo ubuntu-drivers autoinstall
复制代码
或手动安装系统推荐型号:
- sudo apt install nvidia-driver-460
复制代码
step 4: 更新内核模块并重启电脑
- sudo update-initramfs -u # 更新 initramfs
- sudo reboot
复制代码
14.安装CUDA
1)从官网下载对应版本CUDA
首先使用nvidia-smi指令,出现的CUDA Version代表你可以安装的最高CUDA版本,然后在下面网址中选择低于或等于该版本号的CUDA版本即可
各种版本CUDA下载地址汇总
例如CUDA11.2版本下载地址:
CUDA11.2下载网址
下载指令:
- wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run
复制代码
2)gcc 降级
Ubuntu20.04自带的gcc版本为9.7.0,需要添加gcc7才可以安装cuda11.2, 输入命令安装gcc7
- apt-get install gcc-7 g++-7
复制代码
查看gcc版本,可以看到目前系统中存在7和9两个版本
- ls /usr/bin/gcc*
- ls /usr/bin/g++*
复制代码
使用update-alternatives进行版本切换,输入以下命令
- sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 100
- sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 50
复制代码
此时输入sudo update-alternatives --config gcc命令查看gcc的默认版本,可以看到当前默认gcc版本为7,即切换成功。
3)安装CUDA
输入命令进行安装
- sudo sh cuda_11.2.0_460.27.04_linux.run
复制代码
选择continue–>输入accept–>按空格去掉安装显卡驱动的选项-->选择install
若第1步提示Existing package manager installation of the driver found. It is strongly recommended that you remove this before continuing.,选择continue,在下一步中去除driver项,之后选择install
4)配置环境变量
gedit ~/.bashrc
- export PATH=/usr/local/cuda-11.2/bin${PATH:+:${PATH}}
- export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
复制代码
source ~/.bashrc
5)安装完成,输入nvcc -V命令查看cuda信息
6)若需要卸载CUDA:
- cd /usr/local/cuda-11.2/bin
- sudo ./cuda-uninstaller
复制代码
会弹出来很多选项,使用Enter键全部选中,然后点击Done即可,卸载可能会持续一小会儿时间,耐心等待即可。
- cd /usr/local/
- sudo rm -rf cuda-11.2
复制代码
接下来删除相关文件夹
- # 删除 CUDA 12.5 主目录
- sudo rm -rf /usr/local/cuda-11.2
- # 删除 CUDA 符号链接(如果存在)
- sudo rm -f /usr/local/cuda
复制代码
清理环境变量gedit ~/.bashrc,删除以下类似行(具体路径根据实际安装版本调整)
- export PATH=/usr/local/cuda-11.2/bin:$PATH
- export LD_LIBRARY_PATH=/usr/local/cuda-11.2/lib64:$LD_LIBRARY_PATH
复制代码
生效配置source ~/.bashrc
验证是否卸载彻底
- # 检查 CUDA 目录是否存在
- ls /usr/local/cuda-11.2 # 应提示 "No such file or directory"
- # 检查 nvcc 是否残留
- which nvcc # 应无输出
- # 检查 CUDA 环境变量
- echo $PATH | grep cuda # 应无输出
- echo $LD_LIBRARY_PATH | grep cuda # 应无输出
复制代码
15.安装cuDNN
1)查看cuDNN版本和CUDA版本的关系,并下载对应版本的cuDNN:
cuDNN Archive
我选择的是Local Installer for LInux_x86_64(Tar)
2)解压,得到名为cuda的文件夹:
- tar -xvf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz
复制代码
3)将include/cudnn.h文件复制到usr/local/cuda/include文件夹,将lib/下所有文件复制到/usr/local/cuda/lib64文件夹中
先cd到解压后的文件夹(这个文件夹以前叫cuda,现在是压缩包的名字)。
- sudo cp include/cudnn.h /usr/local/cuda/include
- sudo cp include/cudnn_version.h /usr/local/cuda/include/
- sudo cp lib/libcudnn* /usr/local/cuda/lib64
复制代码
4)添加权限
- sudo chmod a+r /usr/local/cuda/include/cudnn.h
- sudo chmod a+r /usr/local/cuda/include/cudnn_version.h
- sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
复制代码
5)更新动态库连接
安装完成
5)查看版本(8.0以后版本)
- cat /usr/local/cuda/include/cudnn_version.h |grep CUDNN_MAJOR -A 2
复制代码
即版本为8.1.1
6) 卸载cudnn
- sudo rm -rf /usr/local/cuda/include/cudnn.h
- sudo rm -rf /usr/local/cuda/lib64/libcudnn*
复制代码
查询
- sudo dpkg -l | grep cudnn
复制代码
将查询结果全部卸载
- sudo dpkg -r libcudnn8-samples
- sudo dpkg -r libcudnn8-dev
- sudo dpkg -r libcudnn8
复制代码
再次进行查询,如果没有任何输出即为卸载成功。
16.安装多版本cuda&cudnn
1)按照上文步骤安装另一个版本的cuda
2)可以在/usr/local/目录下查看自己安装的cuda版本
3)我们安装了cuda10.1,cuda9.0,而cuda是一个软链接,它指向我们指定的cuda版本
在设置环境变量时,使用的是cuda,而不是cuda-10.1和cuda-9.0,主要是方便我们切换cuda版本,不用每次都去设置环境变量的值
查看cuda指向的版本:
4)查看cuda,发现文件类型是symbolic link,而指向的目录正是/usr/local/cuda-9.0,当我们想使用cuda-10.1版本时,只需要删除该软链接,然后重新建立指向cuda-10.1版本的软链接即可
- sudo rm -rf /usr/local/cuda
- sudo ln -s /usr/local/cuda-10.1 /usr/local/cuda
复制代码
17. cuda 11情况下如何配置pytorch 10.2
请参考博客:
cuda 11情况下如何配置pytorch10.2