动手学习深度学习全纪录
记录全过程
前言:折腾了一天终于折腾完了。
wsl2 链接到代理
为什么要连接? 因为下载anaconda实在是太慢了。。
首先是wsl2 搭载 windows代理,如何让wsl2 能够跟windows一样可以访问google呢?通过资料的收集,查找到以下解决方法。
将下列内容添加到.bashrc文件中
1 | host_ip=$(cat /etc/resolv.conf | grep nameserver | awk '{print $2}') |
然后启动生效
1 | source ~/.bashrc |
这样就能链接到网络了,这样下载镜像不至于很慢。另外思考 wsl 跟本机是如何连接的?看了相关资料,发现相当于一个局域网。我们可以打开clxxh的 允许局域网连接就行,,这样同时允许多个接入。
即使你电脑代理关了,但是wsl2还是可以连接到的,所以没事。
成果图:
配置相关环境
昨天是用的wsl + docker 思来想去 还是太麻烦,打算用李沐老师说的第二种方法。nvidia + conda
第二种应该是最方便的,第一个和第三个 老师都给了很详细的说明,第二个可以按需分配。
我们首先先下载anaconda , 同时也参考了这个视频。手把手配置。
但是你用外国的源,不用国内的源 ,你不开代理下载巨慢,或者你可以找找清华源,然后下载镜像。
下载好之后 通过一下命令来安装
1 | sh Anaconda3-2022.10-Linux-x86_64.sh |
然后无脑ok 之后 按yes 回车 确认安装。
然后安装在默认路径。 安装好之后 就可以参考官网安装对应的包了。 参考网站在这里:动手学习
首先我们先创建虚拟环境。
1 | conda create --name d2l python= 3.9 -y |
创建好之后,激活环境
1 | conda activate d2l |
接下来我们就可以安装相对应的包了。
根据视频教程,是直接执行下面的步骤的,
我最开始装了 很成功,然后 安装jupyter lab 等等 ,可以成功跑起来,但是跑第七章用gpu跑,发现 不太成功。
还以为没有安装gpu的版本。 但是后面测试 发现是可以用gpu的。不太懂 我又删除环境,重新安装。后面才知道显卡不行,直接爆显存了。。 这都是后话了。
于是我又开始折腾,通过自己查找资料,去学习。发现要安装带gpu的版本,要带cudatoolkit 这种,由于我的驱动是11.5版本的,但是官网最低貌似是11.8。我只好下载之前的版本,history。
利用这个指令来安装 相关工具包
1 | CUDA 11.3 |
发出类似的警告:
后面加了啥配置,需要他灵活解决,可惜这里忘记记录了。在conda找到所需要的包之后就会给你一个安装列表,然后确定安装即可。
安装完之后 我们可以看 cuda 是否可以使用gpu
进入虚拟环境 然后打开python 输入下列指令
1 | import torch |
经过测试 可行
1 | PyTorch版本: 2.3.1 |
1 | import torch |
之后安装相关的包 d2l
1 | pip install d2l==0.17.6 |
在执行这个的过程中,报错了。情况如下。
发现依赖好像起冲突了。只好重新安装一次,这次先安装d2l 在安装jupyter lab .
1 | jupyter lab --ip 0.0.0.0 --allow-root |
启动。 在本机127.0.0.1:8888 就可以打开了。
然后跑alexnet 模型。由于显卡有限 只能把batch 调小一点,调成 size = 16 。
跑了半小时 ,终于大功告成。 配环境是最麻烦的。。
能用别人的服务器最好,省的配置了。。发现一个宝藏网站,以后再琢磨。启智
后记:真的太折磨了,环境配置,动手才是真理,有正反馈,光看是不行的。