「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美
最近市場上推出了 PCI-E Gen5 的 SSD,但和 Gen4 剛推出時一樣,價格仍然相對昂貴。回顧一下硬碟的發展速度,我們從 SATA 500MB/s 的時代,跳升到 PCI-E Gen3 的 3,000MB/s,再到 PCI-E Gen4 的 7,000MB/s,現在又有 PCI-E Gen5 12,000MB/s 的高速規格,這種速度提升的進步真是迅猛。
但除了規格上的速度提升之外,Gen5 相對 Gen4 在其他方面是否有更多幫助呢?這次透過對美光 Crucial T700 Gen5 SSD 與 Crucial P5 Plus Gen4 SSD 兩條 SSD 做不同的測試,來看看兩者在各種情況上的差異。

簡介 - DirectStorage API

硬碟的發展速度實在驚人,我還記得以前 SSD 還貴的時候,基本上要 1TB 以上的容量,都會選擇 HDD。但現在,除非需要大容量儲存,如 4TB 以上的資料,不然都直接用 SSD 了。尤其是現在許多遊戲開始要求安裝在 SSD 上,否則遊戲讀取速度真的會太慢。我甚至考慮是否要將遊戲安裝在 PCI-E SSD 上,因為 SATA SSD 的速度最高也只有 560MB/s,而 PCI-E SSD 可以輕鬆超過 3,000MB/s。

近年來,PCI-E SSD也經歷了許多變革,速度不斷倍增,直到最新的 PCI-E Gen5 世代,速度已經達到 12GB/s,實在嚇人。正因如此,隨著 SSD 速度的不斷提高,微軟也推出了新技術,以利用 SSD 的高速讀寫優勢來提高遊戲體驗,它就是 DirectStorage。DirectStorage API 是一個微軟自 Xbox 下放到 Windows 的一個遊戲技術。簡單來說,以前遊戲需要讀取地圖、材質等數據時,必須首先從硬碟讀到記憶體,然後通過 CPU 進行處理,最後再交給 GPU 進行渲染。這樣的過程不僅會受限於硬碟較慢的 I/O 速度,還會卡 CPU 瓶頸。
投影片17.JPG

這時候,DirectStorage 就派上用場了,它允許數據直接從硬碟讀取到 GPU,然後在 GPU 上進行處理,如解壓縮、解碼等等。這樣,遊戲就不需要再等待 CPU,運行速度也變得更快。當然,前提是硬碟的速度足夠快,就像我們這次測試的 Crucial P5 Plus 和 T700 這樣高速的硬碟。如果硬碟讀取速度慢,那麼等待時間仍然會集中在 I/O 上,DirectStorage 的優勢就不明顯了。
投影片18.JPG

接下來,我們使用了微軟提供的兩個 DirectStorage API demo 來測試 DiretStorage 的差異。首先是讀取多個模型與貼圖到 GPU,比較頻寬與 CPU 使用率,結果如下,可見到 Gen5 世代的 Crucial T700 擁有較短的讀取時間與較高的頻寬。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

接下來測試通過 DirectStorage 將圖片加載到 GPU 進行解壓縮的速度。結果如下,可以看到 T700 在頻寬方面表現得更好。
投影片20.JPG

除了 DirectStorage,還有類似的技術,比如 NVIDIA 的 RTX IO。隨著這些技術的出現,可以預見將來遊戲對硬碟速度的需求會越來越大。但現在,讓我們來測試看看將遊戲安裝在 Gen4 和 Gen5 SSD上是否會有什麼不同。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

開箱 - Crucial T700 & P5 Plus SSD

簡單介紹這次待測的 SSD,分別是美光最新的 Crucial T700 Gen5 SSD 與 Gen4 世代的 Crucial P5 Plus。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

Gen5 的 Crucial T700 帳面規格讀取可達 12.4GB/s,寫入 11.8GB/s。Gen4 的 Crucial P5 Plus 讀取可達 6,600MB/s,寫入 5,000MB/s。從這兩條 SSD 也可以看到這散熱片的厚實,足足比 Gen4 的 P5 Plus 厚了一圈,可見 Gen5 SSD 的火熱程度。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

測試 - Crucial T700 & P5 Plus SSD

測試平台的規格如下:
CPU:Intel Core i9-12900K
MB:ASRock Z790 Steel Legend WiFi
RAM:Crucial DDR5 Pro 5600 16GB × 2
Graphics:PNY GeForce RTX 4070 Ti XLR8
OS Drive:Crucial T700 2TB(主機板散熱片)
Test Drive 1:Crucial T700 2TB(自帶散熱片,走 CPU PCI-E M.2 通道)
Test Drive 2:Crucial P5 Plus 2TB(自帶散熱片,走 CPU PCI-E M.2 通道)
Cooling:darkFlash DX360 v2 A-RGB
Case:InWin 303C
Power:FSP Hydro PTM PRO 850W
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

因為我們有三條 SSD,我們將有散熱片的款式作為測試對象,所以 OS 安裝在沒有附帶散熱片的 T700 上。待測的兩條 SSD 都會輪流安裝在 Z790 的 M.2_2 插槽中,這個位置確保了 SSD 可以使用 CPU 提供的 PCI-E Gen5 通道。然而,由於這個位置需要與顯示卡共享頻寬,因此當使用 M.2 時,顯示卡只能使用 PCI-E 4.0 x8。因此,不論是 Gen4 的 P5 Plus 還是 Gen5 的 T700,本次測試都將使用這個位置的 M.2 通道,以確保公平的測試基準。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

首先看到代表著理論性能的 CrucialDiskMark,以最佳效能檔位搭配讀取混合模式,得到以下成績。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

AIDA64 線性全硬碟讀取,也可以看到 T00 的速度是 P5 Plus 的兩倍。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

AIDA64 線性全硬碟寫入,T700 平均速度高一些。在 SLC 快取內速度更可高達 9,000 多 MB/s,不過寫入超過 40% 後,會降速降到比 P5 Plus 還慢一些。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

PCMark 10 Full System Drive Benchmark,T700 得分 5362。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

對比 P5 Plus,得分為 2944。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

不過這些都是理論上的表現,實際上呢?首先看到遊戲部分:微軟自家的賽車遊戲 Forza Horizon 5,這款遊戲是微軟工作室開發的,以它做為測試基準非常合適。這邊測試多個場景的平均讀取速度,可看到讀取速度 T700 平均快了 5 秒鐘。
投影片8.JPG

FPS 大作 Call of Duty: Modern Warfare II,多個場景讀取平均只快了 0.26 秒,畢竟 CoD 的地圖面積偏小。
投影片9.JPG

另一款 FPS 大作 BattleField 2042,多個地圖讀取平均…欸?超車了,P5 Plus 反而快了 3 秒。
投影片10.JPG

同樣的情形也發生在 Cyberpunk 2077 中,讀取速度反而是 P5 Plus 快了 1.3 秒。
投影片11.JPG

而以 CS: GO 這款知名的射擊遊戲而言,讀取速度的優勢使的 T700 回到了領先位置,平均比 P5 Plus 快了 1.9 秒。
投影片12.JPG

知名農 Game 原神,T700 在地圖傳送的速度平均快了 P5 Plus 0.19 秒,但考慮到這款遊戲的傳送所需時間最久也才 4.26 秒,0.19 其實也是蠻大幅度的提升。
投影片13.JPG

Final Fantasy XIV,平均讀取 T700 快了 0.21 秒,總共差距 1.1 秒。
投影片14.JPG

從以上幾款遊戲看來,Gen5 的 T700 相比 Gen4 的 P5 Plus,雖說多數情況下較快,但快的程度其實不明顯。但這樣也蠻符合預期的,畢竟現在遊戲幾乎都是針對 Gen3、Gen4 的 SSD 設計,自然不會對 Gen5 的高速 SSD 做最佳化。但如果對比的是 Gen3、SATA SSD,甚至是傳統硬碟的話,我敢說這差距絕對是用感受就能體現出差異了。且相信在不久的未來,遊戲一定還會有更多對於 Gen5 SSD 的調整與最佳化。以目前已經上市的遊戲作為例子,今年初上市的 Forspoken,以及近期從 PS5 移植至 PC 的 Ratchet & Clank: Rift Apart 有支援 DirectStorage,且僅有後者支援 GPU 解壓縮, 暗黑破壞神 Diablo IV 則是預計在未來的更新中新增支援 DirectStorage。此外,GPU 製造商也需要微調驅動程式,避免 DirectStorage 功能消耗過多運算資源而影響原本的渲染繪圖工作,這些都需要時間以優化效能,近一步發揮 Gen5 SSD 的價值。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

至於專業應用部分,我首先測試了透過 Davinci Resolve 輸出影片,在我的專案中,輸出的速度基本上差不多,沒有明顯差距。
投影片16.JPG

而 AI Training 部分,我測試了用 transformers 搭配 PyTorch library 跑 ResNet50 image classification,分別用 8500 張的 RGB 224×224、512×512、1024×1024、2048×2048 的解析度跑訓練,結果如下。可以看到直到影像大小是 2048×2048 時,T700 才能呈現出較好的表現。其餘解析度下,使用 Gen5 的 SSD 並不會有特別的提升。
投影片15.JPG

結論 - Crucial T700 vs P5 Plus SSD

「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

在這次的測試中,我們對美光的 PCI-E Gen4 和 Gen5 SSD 進行了不同類型的測試。從結果來看,Gen5 的 Crucial T700 在多數遊戲中確實表現出較快的讀取速度,從而減少了遊戲的載入時間,但這種減少的幅度並不像跑分測試中那麼明顯。在專業軟件表現方面,就 Davinci Resolve 輸出 FHD 影片的結果來看,Gen5 的 T700 並沒有優勢。然而,影片剪輯的過程並不僅僅是輸出,還包括了文件傳輸、素材引入和同步等步驟,擁有 12GB/s 讀取和 11GB/s 寫入速度的 Crucial T700 在這些方面會更有優勢,文件載入速度也會更快,是 T700 會比較吃香的地方。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

然而,在 AI 訓練方面,我有些驚訝兩款 SSD 居然無法拉開差距,因為在 AI 訓練的過程中,包括大量的硬碟讀取。根據測試結果,除非您的原始圖片解析度非常高,達到 1024×1024 以上,否則 PCI-E Gen5 的 SSD 難以體現出差距。但請不要誤會我的意思,無法體現出差距是因為 Gen4 的 P5 Plus 速度已經非常快了,如果對比的對象是傳統硬碟,那麼 SSD 對於訓練速度的提升仍然非常明顯。
「評測」PCI-E Gen5 Gen4 SSD 速度之戰,美

總之,根據目前的情況,我認為 Gen5 相對於 Gen4 的提升仍然有限,但隨著時間的推移,例如更多的遊戲引入 DirectStorage API,或者由於硬碟速度的演進,遊戲開發商將進一步優化遊戲以利用高速 SSD,Gen5 的優勢可能會變得更加明顯。如果你追求極致性能,並且願意為之付出較多的預算,那麼 Gen5 的 SSD 是不錯的選擇,它能夠提供當前市場上最高速的讀寫速度。不過,如果你的主要用途是遊戲,Gen4 的 SSD 已經能夠提供出色的性能,並且價格相對較低,因此也是一個不錯的選擇。最終,選擇 Gen4 還是 Gen5 SSD 取決於你的預算和性能需求,以及你對未來的需求預期如何。

 

如果你喜歡我的觀點, 歡迎底下留言討論並到FB粉絲頁討論串留言喲
arrow
arrow

    阿湯 ATon 發表在 痞客邦 留言(0) 人氣()