愛鋒貝

標(biāo)題: 顯卡RTX4090購買和深度學(xué)習(xí)配置,最后用Mac遠(yuǎn)程登錄 [打印本頁]

作者: 小米搞機(jī)員    時(shí)間: 2023-4-4 22:02
標(biāo)題: 顯卡RTX4090購買和深度學(xué)習(xí)配置,最后用Mac遠(yuǎn)程登錄
原文參考鏈接:
本文主要內(nèi)容:
這兩天買了一張RTX4090的顯卡,就在以前的主機(jī)上安裝和配置了一下,把過程記錄下來,有需要的人可以參考一下,先上一個(gè)成品圖:

(, 下載次數(shù): 88)

Part1 硬件選購

主機(jī)是2020年買的,可以根據(jù)需要買更高配的。

(, 下載次數(shù): 83)
本次要更換的就是紅框中的三個(gè),顯卡、內(nèi)存、電源,其他的都還能用。
1、 硬件該怎么選?

這個(gè)我朋友也給了我很多的參考建議,包括各個(gè)硬件都換一遍如何選,也參考了知乎@良睦路程序員[1]的回答。
為了不花冤枉錢還能達(dá)到目標(biāo),我就換了這三個(gè) :

(, 下載次數(shù): 94)

顯卡,我建議買品牌的

(, 下載次數(shù): 88)
想換4090 24G顯卡,電源肯定要跟上(換成了1000w以上),內(nèi)存原來16G也是短板,這次換成32G的。機(jī)箱能放得下顯卡(長度要注意) 。
內(nèi)存要分清楚主機(jī)上支持DDR4還是DDR5哈:
電源1kw以上即可,我用的長城的:
這里也收集了一些顯卡的參數(shù)對比,僅供參考。 渦輪卡一些參數(shù):

(, 下載次數(shù): 87)
公版卡參數(shù)(難買到):

(, 下載次數(shù): 88)

2 如何買?

顯卡畢竟很貴,最擔(dān)心是買到礦卡,我朋友建議的品牌:影馳、技嘉、微星,不著急可以等活動省大幾百塊。
不要去二手店、組裝店之類的,很可能會買到二手卡。
同一品牌下的同一款卡,還會配不同套裝,比如水冷、RGB燈之類的,根據(jù)自己喜好和預(yù)算選一個(gè)即可。
Part2 、深度學(xué)習(xí)環(huán)境配置

我們拆機(jī)組裝好后【如果不知道如何裝機(jī),自行搜視頻看哈】,就開始安裝一些軟件了。
設(shè)備管理器中可以查看:

(, 下載次數(shù): 77)

3、顯卡驅(qū)動安裝:

要在Windows上使用4090做模型訓(xùn)練,一方面要下載顯卡驅(qū)動[2]https://www.nvidia.cn/geforce/drivers/,另外要訓(xùn)練神經(jīng)網(wǎng)絡(luò)我們要安裝CUDAtoolkit和cuDNN。
如圖:

(, 下載次數(shù): 78)
根據(jù)自己的系統(tǒng)和顯卡型號搜索一下即可。
經(jīng)驗(yàn)告訴我不要使用最新的版本,dddd(懂的都懂)。4090顯卡需要“驅(qū)動程序版本: 526.98 - 發(fā)行日期: 2022-11-16”及以上。
下載后,根據(jù)推薦一路點(diǎn)下去安裝。不用管界面顯示哪個(gè)路徑,那個(gè)是臨時(shí)的,最終會自動刪除,并最終安裝在默認(rèn)路徑:
C盤的 NVIDIA Corporation
C盤的 NVIDIA GPU Computing Toolkit
這時(shí)候,可以打開終端(win + R 快捷鍵),輸入cmd,終端輸入 nvidia-smi 查看:

(, 下載次數(shù): 72)
這里哪怕是12.x版本也沒事,我們可以使用conda管理我們的項(xiàng)目環(huán)境,只需要那里的cudatoolkit和cudnn版本一致即可。原因下文有解釋。
4 cudatoolkit和cudnn 安裝

也可以單獨(dú)再下載 11.8版本的cudatoolkit[3]和對應(yīng)的cuDNN[4]https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-download
一路點(diǎn)擊安裝即可。

(, 下載次數(shù): 105)
cuDNN的下載需要注冊,挺麻煩,11.8版本的我上傳到網(wǎng)盤了,文末可以獲取連接哈。
下載后解壓,對應(yīng)目錄的文件,復(fù)制到剛剛安裝cuda toolkit同名文件夾下即可。

(, 下載次數(shù): 118)

如果沒有正常顯示,可以查看系統(tǒng)環(huán)境變量:
**win+i快捷鍵** 打開配置,
依次點(diǎn)擊"系統(tǒng)"、"關(guān)于"、"高級系統(tǒng)設(shè)置"就能打開系統(tǒng)屬性,
在“高級”下點(diǎn)擊“環(huán)境變量N”,
在系統(tǒng)變量中找到path并雙擊。
以下如果沒有就添加:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\libnvvp
nvcc 屬于CUDA的編譯器,將程序編譯成可執(zhí)行的二進(jìn)制文件,nvidia-smi 全稱是 NVIDIA System Management Interface ,是一種命令行工具,幫助管理和監(jiān)控NVIDIA GPU設(shè)備的。
nvcc是與CUDA Toolkit一起安裝的CUDA compiler-driver tool,它只知道自身構(gòu)建時(shí)的CUDA runtime版本,并不知道安裝了什么版本的GPU driver。
5 conda環(huán)境管理

Python項(xiàng)目環(huán)境依賴的版本讓人很不好搞,對于不同cuda版本依賴,我們可以使用conda創(chuàng)建新環(huán)境,并安裝對應(yīng)的版本。 之前也寫了一篇conda環(huán)境管理的文章。
conda install  -c conda-forge cudatoolkit=11.8
conda install -c conda-forge cudnn
conda會自動給匹配合適的對應(yīng)版本。
哪怕本機(jī)部署Docker鏡像,根據(jù)版本拉取hub中的鏡像即可,例如:
docker pull pytorch/pytorch:1.13.1-cuda11.6-cudnn8-runtime
Part3 Mac 遠(yuǎn)程連接

Mac上可以遠(yuǎn)程ssh登錄Win電腦,也可以使用相關(guān)軟件,我用的Microsoft Remote Desktop,國內(nèi)的APP store可能不可以下載,我這里放在了網(wǎng)盤,見文末。
這樣,主機(jī)打開,不需要額外顯示器,而且可以Mac OS 和Windows系統(tǒng)無縫切換。
1、安裝 openssh 可以通過系統(tǒng)設(shè)置安裝:
https://learn.microsoft.com/zh-cn/windows-server/administration/openssh/openssh_install_firstuse?source=recommendations
也可以通過powerShell安裝。
Windows系統(tǒng)左下角的系統(tǒng)按鈕,右鍵找到“命令提示符(管理員)”,全程需要管理員權(quán)限的哦。
# 安裝OpenSSH客戶端
Add-WindowsCapability -Online -Name OpenSSH.Client~~~~0.0.1.0

#安裝OpenSSH服務(wù)端
Add-WindowsCapability -Online -Name OpenSSH.Server~~~~0.0.1.0
驗(yàn)證是否安裝成功: 輸入
Get-WindowsCapability -Online | ? Name -like 'OpenSSH*'
返回installed狀態(tài)即可:

(, 下載次數(shù): 83)

2、啟動SSH服務(wù)器
# 啟動sshd服務(wù)
Start-Service sshd

# 將sshd服務(wù)設(shè)置為自動啟動,若不設(shè)置需要在每次重啟后重新開啟sshd
Set-Service -Name sshd -StartupType 'Automatic'

# 確認(rèn)防火墻規(guī)則,一般在安裝時(shí)會配置好
Get-NetFirewallRule -Name *ssh*

# 若安裝時(shí)未添加防火墻規(guī)則"OpenSSH-Server-In-TCP",則通過以下命令添加
New-NetFirewallRule -Name sshd -DisplayName 'OpenSSH Server (sshd)' -Enabled True -Direction Inbound -Protocol TCP -Action Allow -LocalPort 22
3、開啟密鑰登錄
ssh-keygen -t ed25519
如果走默認(rèn)就一直回車,也可以自己定義路徑和文件名,默認(rèn)在: C:\Users\你的用戶名.ssh\id_ed25519 對應(yīng)的還有個(gè)公鑰 id_ed25519.pub
我的這里加了個(gè)后綴,和其他文件區(qū)分開來。

(, 下載次數(shù): 93)

我們將公鑰.pub文件復(fù)制放到Mac系統(tǒng)下 .ssh文件下

(, 下載次數(shù): 97)

在Windows電腦的命令行中輸入 ipconfig 查看 ipv4地址 在Mac終端輸入:
ssh win用戶名@剛剛查看的ip地址


(, 下載次數(shù): 88)
在終端操作需要熟悉Windows中的一些命令。
軟件和本次的驅(qū)動、cuda我都上傳到網(wǎng)盤了。從網(wǎng)盤下載安裝即可。
登錄界面:

(, 下載次數(shù): 90)

配置也簡單: 在“add user account”中添加Windows主機(jī)的登錄賬密,保存下次就直接點(diǎn)擊鏈接了。

(, 下載次數(shù): 85)
6 其他連接方式:

如開頭顯示,我用了投影儀顯示主機(jī)內(nèi)容,一個(gè)投影儀和一個(gè)顯示器也差不多的價(jià)格,但投影儀聯(lián)網(wǎng)還能看視頻看電影(家庭影院),屏幕和電視都是固定大小的屏幕。
一根HDMI線,一頭連接投影儀,一頭連接顯卡上的HDMI口就可以了,投影界面的設(shè)置中,將信號源切換為HDMI即可。
END
本次分享就到這里了,Windows環(huán)境下基于RTX4090顯卡安裝深度學(xué)習(xí)環(huán)境的基本流程,Mac遠(yuǎn)程連接Windows主機(jī)、投影儀連接主機(jī)的相關(guān)圖文教程。
所有文件的百度云盤鏈接需要的留言哈
參考資料

[1]
知乎@良睦路程序員: https://www.zhihu.com/question/586361676/answer/2913703371
[2]
顯卡驅(qū)動: https://www.nvidia.cn/geforce/drivers/
[3]
cudatoolkit: https://developer.nvidia.com/cuda-toolkit-archive
[4]
cuDNN: https://developer.nvidia.com/rdp/cudnn-download

-----------------------------




歡迎光臨 愛鋒貝 (http://m.7gfy2te7.cn/) Powered by Discuz! X3.4