NVIDIA GeForce 20系列

**Geforce RTX 20 系列**
	; RTX 2080Ti 創始版
发布日期	2018年9月20日; 2019年7月9日; (Super系列)
代号	TU10x
架构	Turing
产品系列	GeForce RTX
电晶体	108億 12nm(TU106); 136億 12nm(TU104); 186億 12nm(TU102);
制造工艺	台積電 12nm(FinFET)
显示卡
中端GPU	GeForce RTX 2050; GeForce RTX 2060; GeForce RTX 2060 Super
高端GPU	GeForce RTX 2070; GeForce RTX 2070 Super; GeFroce RTX 2080; GeForce RTX 2080 Super
旗舰GPU	GeForce RTX 2080 Ti; NVIDIA TITAN RTX
API支持
Direct3D	Direct3D 12 (12_2)
OpenGL	OpenGL 4.6
OpenCL	OpenCL 1.2
Vulkan	Vulkan 1.2
历史
前代产品	GeForce 10系列
相关产品	GeForce 16系列
后继产品	GeForce 30系列

NVIDIA GeForce RTX 20系列，是由NVIDIA繼GeForce GTX 10系列后開發的圖形處理器系列。於2018年8月20日的Gamescom（科隆遊戲展）上发布。[1][2][3]本系列首發產品是GeForce RTX 2080及2080Ti，2018年9月20日正式發售[4]。此系列產品新命名為RTX，而未沿用推出多年的GTX，以突顯支援光线跟踪的特色。

架构特性

RTX 20系列基于图灵微架构（Turing），具有实时光线跟踪（Ray tracing）功能。[5]通过使用RT核心（光線追踪運算核心）可以加速这一过程。这些核心能够高效处理四叉树和球形层次结构，并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。

RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统立方体贴图和深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真，尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。

张量運算核心（Tensor Core）进一步加速了光线追踪，并用于填充部分渲染图像中的空白，这种技术被称为「降噪」。张量核心原是為深度学习而設計的，例如学习如何提高图像的分辨率。但通常消费者的张量核心主要是执行一些已经完成的深度学习模型，这些模型是在超级计算机进行分析和解决的，超级计算机确定如何实现这些目标的方法，例如学习如何提高图像的分辨率，然后由消费者的张量核心实际使用这个方法，也就是使用超级计算机找到的方法来提高图像的分辨率。

因此，圖靈架構的光線追蹤特性，實際上是舊有光線追蹤技術與近年興起的人工智慧（AI）、深度學習結合的產物，先是利用光線追蹤專用的運算單元RT core生成圖像的關鍵要素，剩餘的非關鍵要素則是交由深度學習運算單元Tensor Core來補全，而圖像中的關鍵要素，也藉由Tensor Core執行相關的深度學習程式來決定。除此以外，Tensor Core還被用於執行消除混疊的深度學習程式（深度學習超級採樣，DLSS），來柔化畫面鋸齒邊緣。[6]

將深度學習、光線追蹤用於畫面運算雖然不是首個，NVIDIA早在基於帕斯卡、伏打圖形處理微架構的GeForce GTX TITAN系列上有先行鋪路，光線追蹤更是早已有之的技術，只是當時裝置的效能僅能到作生成靜態畫面之用，而本代GeForce RTX系列則是首個在畫面處理中大量使用深度學習技術、引入與深度學習相結合的光線追蹤實時動態畫面技術的圖形處理器。不過它仍然保留了效能強勁、規格龐大的傳統光柵化渲染3D畫面所需的運算組件。[7]

細節

採用台積電12nm FFN製程打造，由伏特微架構使用的12nm FFC製程改進（但本質上依舊是台積電16nm FF+製程的延伸版本），性能是後者的1.1倍，功耗只有後者的70%，核心面積則可以縮小20%
為容納數量龐大的運算單元，核心面積相比帕斯卡微架構的大幅增加，由GP102（GeForce GTX 1080Ti）的471mm²增加至TU102（GeForce RTX 2080Ti）的754mm²
CUDA 7.5
採用全新的SM陣列設計: TPC包含了兩個SM單元(Pascal為1個)，SM單元重新分配為64個FP32、64個INT32、8個Tensor Core 、1個RT Core ，同時添加了獨立的INT數據路徑，支援FP32和INT32操作的並發執行。
為共享暫存、一級暫存、紋理暫存引入了統一架構，一級暫存與共享暫存大小是靈活可變的，可以根據需要在64+32KB或者32+64KB之間變換，讓一級暫存更充分利用資源，也減少一級暫存延遲，並提供比Pascal GPU中使用的一級暫存更高的頻寬，同時二級暫存容量提升。
Tensor Core（張量核心） : 負責人工智慧、神經網路運算，增加了新的INT8和INT4精度模式，FP16半精度也能夠被完整支援通常會用到矩陣融合乘加(FMA)運算，新的INT8精度模式的工作速率是此速率的兩倍，張量核心為矩陣運算提供了顯著的加速，除了新的神經圖形功能外，還用於深度學習訓練和推理操作。
NGX (Neural Graphics Acceleration)框架: 利用張量核心，在遊戲中實現深度學習功能，GeForce Experience會自動匹配Turing顯卡並且下載可用的NGX Core軟件包，對應如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
DLSS (深度學習超級採樣) : 反鋸齒技術，利用張量核心實現在較低的輸入樣本數下更快地渲染，具有與64×超級採樣畫面相同品質的細節，還可以避免TAA產生的運動模糊等問題，相比TAA等其它反鋸齒技術，渲染能力得到大幅提升。
AI InPainting : 算法利用大量真實世界圖像的訓練，可以補全圖片中缺失的內容，也可以移除照片的噪點、失真部分以及增強照片的清晰度等功能。
AI Super Rez : 將原影片的解析度清晰地放大2倍、4倍、8倍，圖像更加銳利。
AI Slow-Mo : 將普通常見的30fps進行智慧補幀計算，可以獲得240/480fps的慢動作影片，而不需要專門高幀率攝影機。
RT Core : 專門為光線追踪計算，是一條特異化的專用流水線，用於加速計算邊界體積層次（BVH）遍歷以及光線和三角求交（光線投射）。
GDDR6顯示記憶體的支援
附有影像串流壓縮技術（Display Stream Compression，DSC）1.2版的DisplayPort 1.4a
功能集JPureVideo的硬體加速視訊解碼
NVLink連接器（與伏打微架構的不相容）
VirtualLink VR
GPU Boost 4[8]

設計

RTX是GeForce 20系列引入的开发平台。RTX的光线追踪示范程序中使用了微软的DXR，OptiX和Vulkan来进行光线追踪。[9]

芯片规格

型號	推出日期	核心代號	製程 (nm)	晶体管數 & 晶粒面積	核心配置				時脈頻率			填充率		顯示記憶體				運算性能 (TFLOPS)				每秒光線數 (十億)	匯流排介面	TDP (W)	NVLink 支援	發售價格(美金)
型號	推出日期	核心代號	製程 (nm)	晶体管數 & 晶粒面積	核心組態 ^{SPs:TMUs:ROPs[lower-alpha 1]}	光追核心	張量核心	二級暫存 (MB)	預設 (MHz)	加速 (MHz)	記憶體 (MT/s)	像素 (GP/s)	材質 (GT/s)	容量 (GB)	頻寬 (GB/s)	類型	介面頻寬 (位元)	單精度 (加速)	雙精度 (加速)	半精度 (加速)	張量浮點	每秒光線數 (十億)	匯流排介面	TDP (W)	NVLink 支援	零售版	創始版
GeForce RTX 2060	2019年 1月15日	TU106- 200A- KA-A1	12	108億 445mm²	1920:120:48 （30 SM）	30	240	3	1365	1680	14000	65.52	163.8	6	336	GDDR6	192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5	PCIe 3.0 x16	160	否	$349
GeForce RTX 2060 TU104	2020年 1月10日	TU104- 150-KC- A1		136億 545mm²	1920:120:48 （30 SM）	30	240	3	1365	1680		65.52	163.8	6	336		192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5		160		$300
GeForce RTX 2060 Super	2019年 7月9日	TU106- 410- A1		108億 445mm²	2176:136:64 （34 SM）	34	272	4	1470	1650		90.5	191.4	8	448		256	6.12 (7.18)	0.19 (0.22)	12.2 (14.4)	57.4	6		175		$399
GeForce RTX 2070	2018年 10月17日	TU106- 400-A1			2304:144:64 （36 SM）	36	288		1410	1620		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499	不適用
GeForce RTX 2070	2018年 10月17日	TU106- 400A-A1			2304:144:64 （36 SM）	36	288		1410	1620+		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499+	$599
GeForce RTX 2070 Super	2019年 7月9日	TU104- 410-A1		136億 545mm²	2560:160:64 （40 SM）	40	320		1605	1770		102.72	256.8					8.22 (9.06)	0.26 (0.28)	16.4 (18.1)	72.5	7		215	2路 NVLink	$499
GeForce RTX 2080	2018年 9月20日	TU104- 400-A1			2944:184:64 （46 SM）	46	368		1515	1710		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5	8				$699	不適用
GeForce RTX 2080	2018年 9月20日	TU104- 400A-A1			2944:184:64 （46 SM）	46	368		1515	1710+		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5					$699+	$799
GeForce RTX 2080 Super	2019年 7月23日	TU104- 450-A1			3072:192:64 （48 SM）	48	384		1650	1815	15500	105.6	316.8		496			10.1 (11.2)	0.32 (0.35)	20.3 (22.3)	89.2			250		$699
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300-K1- A1		186億 754mm²	4352:272:88 （68 SM）	68	544	5.5	1350	1545	14000	118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999	不適用
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300A-K1- A1			4352:272:88 （68 SM）	68	544	5.5		1545+		118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999+	$1,199
NVIDIA Titan RTX	2018年 12月18日	TU102- 400-A1			4608:288:96 （72 SM）	72	576	6		1770		129.6	388.8	24	672		384	12.4 (16.3)	0.39 (0.51)	24.9 (32.6)	130.5	11		280		$2,499

流處理器數量 : 纹理映射單元數量 : 渲染输出单元數量

另见

參見

. TechRadar. [2018-08-21]. （原始内容存档于2018-08-20）（英语）.
. Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.
. Polygon. [2018-08-20]. （原始内容存档于2018-08-20）.
. Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.
. The Verge. [2018-08-20]. （原始内容存档于2018-08-20）.
. techbang.com. 2018-08-24 [2018-10-08]. （原始内容存档于2018-10-09）（中文（臺灣））.
. techbang.com. 2018-09-19 [2018-10-08]. （原始内容存档于2018-10-09）（中文（臺灣））.
. AnandTech. [2018-10-08]. （原始内容存档于2018-09-15）.
. Nvidia. [2018-08-21]. （原始内容存档于2018-08-24）.

扩展链接

官方网站
Nvidia Nsight（页面存档备份，存于）
(PDF). Nvidia. Nvidia Corporation. [2018-10-25]. （原始内容存档 (PDF)于2018-09-24）（英语）.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[a-10] 流處理器數量 : 纹理映射單元數量 : 渲染输出单元數量

[1] . TechRadar. [2018-08-21]. （原始内容存档于2018-08-20）（英语）.

[2] . Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.

[3] . Polygon. [2018-08-20]. （原始内容存档于2018-08-20）.

[4] . Ars Technica. [2018-08-20]. （原始内容存档于2018-08-20）（美国英语）.

[5] . The Verge. [2018-08-20]. （原始内容存档于2018-08-20）.

[6] . techbang.com. 2018-08-24 [2018-10-08]. （原始内容存档于2018-10-09）（中文（臺灣））.

[7] . techbang.com. 2018-09-19 [2018-10-08]. （原始内容存档于2018-10-09）（中文（臺灣））.

[anandarch-8] . AnandTech. [2018-10-08]. （原始内容存档于2018-09-15）.

[nvidiartx-9] . Nvidia. [2018-08-21]. （原始内容存档于2018-08-24）.