RTX30时代开启,谈“刀法”,放眼未来

作者:霍波

在9月2日,英伟达在2020年GPU技术大会上发表主旨演讲,英伟达首席执行官黄仁勋先生正式宣布RTX30系列显卡,一系列令人兴奋、划时代的软硬件技术和产品。 本文将从个人的角度,谈谈对显卡性能判断的理解,对近年来显卡系列的看法,以及对部分产品线未来发展的思考。

我们怎么分析显卡性能

在关注特定的显卡系列之前,作者想分享一些分析显卡性能的方法。

当我们在选购一台计算机的时候,第一眼就能看到商品名里后缀的一些关键参数,比如这台机器用什么型号的 CPU、内存多少等等,然后大家可能会再去看一看这个 CPU 的核心数、频率是多少;其实这一思路对于看显卡来说同样适用,因为显卡可以被看作一台独立的计算机,它“寄生”于“宿主”计算机体内,协助“宿主”完成计算任务。所以,大致估计一块显卡的性能就和估计一台计算机的性能差不多,首先也是看它的核心、内存。

RTX 30 时代开启,聊聊“刀法”、看看未来

显卡的核心和计算机的 CPU 类似,都可以从“频率”“核心数”中看出个大概的高下:“频率”代表每个核心每秒能执行的 GPU 指令条数,GPU 的频率越高,一个核心运行同一段计算指令需要的时间就越少;“核心数”代表有多少个不同的核心能一起协作完成这段计算,在计算任务能被均匀分工的情况下,核心数越多,计算所需时间越少。

显卡的核心与计算机的 CPU 不同的是,显卡面对的计算任务相对 CPU 来说较为简单,显卡负责的这部分计算任务往往重复性很高,比如游戏中常用的矩阵运算,这就可以被很平均地分配个多个核心单独计算、最后把答案汇总,所以显卡普遍采用了单个核心构造比 CPU 的简单、核心数很多的设计。

显卡的核心不仅比CPU慢得多,而且在指令执行效率上也有差距:显卡内置的指令相对简单,这意味着相同的任务可能需要比CPU更多的指令,例如修改缓存中的数据。 计算机CPU就像一辆跑车,它可以快速地把人从A到B,如果几十个人需要从A到B,那么开一辆公共汽车可能比好,慢或慢,但可以拉每个人。

RTX 30 时代开启,聊聊“刀法”、看看未来

另一个影响 GPU 性能的重大参数就是显存大小了。显存和计算机内存作用类似,用来暂存数据、供核心计算使用。不过,显卡上并没有自己的硬盘,显存里的数据也不是从硬盘直接读取来的,而是由计算机的内存通过 PCIe 总线发送过来的;游戏中,越是复杂的场景、越高的分辨率,所需要的显存就越多,这时候如果显存越大,显卡能暂存的数据就越多,对从计算机内存传输数据的需求也就越少。

看完了通用的技术总结,再回到本文的核心主角——英伟达 10-30 系列显卡,结论就相对简单了。近年来,显卡和核心设计并没有太大变化,英伟达的 CUDA 核心频率从在 10-30 的发展期间就一直维持在约 1.4-1.7GHz 的水准,同时,显卡的计算任务也一直能比较好地被多核心并行计算,所以我们基本不会太关注显卡的频率,主要从显卡的核心数、显存大小就能大致推断显卡的性能水准。

老黄的“刀法”和命名哲学

英伟达新一代显卡的性能一定程度上是可以预测的,近年的新一代一般会出现“越级打怪”的情况,不知是否是有意而为之。简单来说,新一代的“60”会接近上一代的“70”,新一代的“70”会接近于上一代的“80”,在参数上略逊一筹(毕竟你少付了钱),但得益于新的架构和更高速的显存,整体测试性能上会略胜一筹。

RTX 30 时代开启,聊聊“刀法”、看看未来

RTX 30 时代开启,聊聊“刀法”、看看未来

我们经常用“老黄刀法”来调侃公司精准产品细分定位的“神奇力量”,预算多少,想要什么样的产品,都能在显卡包装中找到想要的目标,“参数少一点,性能多一点”,刀法精准,耐人寻味,给人一种不涨价的真诚感。

对10-30系列的回顾将使我们更好地理解商法,更清楚地了解即将到来的30系列:

GTX10系列:树立准确的市场定位

RTX 30 时代开启,聊聊“刀法”、看看未来

英伟达的显卡在2016年进入了“10XX新时代”的四位数字,首次发布了1060、1070和1080系列,第一个公共版本(创始人版)的价格分别为300、450和700$。 这三款产品涵盖了主流玩家对显卡性能的需求,并设定了相对合理的价格梯度。

明年,nvda发布了1070Ti和1080Ti作为升级版。 1070TiCUDA核心从1920年增加到2432年,2560直1080;1080Ti几乎$泰坦X(在3584的CUDA核心上的1200),黄只是在1GB的存在下轻微的切割,以表示尊重。 1080Ti以700$的价格出售,成为良心牌的旗舰。 一个轶事是,我在2016年8月以两百多美元的价格开始了一个新的1060G的非公开版本,后来在2018年初,由于比特币的开采很热,显卡价格飞涨,我以前卖这张显卡,比你买的时候多$20多张。

RTX20系列:打破上一代的命名规则

RTX 30 时代开启,聊聊“刀法”、看看未来

当20系列显卡在2018年发布时,挖比特币的热度消退了,但显卡市场的热度持续,英伟达借此机会提高了进入显卡的“门槛价格”,以加速光跟踪“。

起初,RTX2060没有开始,如果你想要第一个RT X射线跟踪经验,购买RTX2070;至少$500RTX2080,RTX2080Ti,对于同一批,后者的成本$1200,比前者高出400多$。 在此之前,“Ti”后缀通常指向对原始产品线的小升级,如GTX1070Ti和GTX1080Ti,比前一年的GTX1070和GTX1080都是“数量没有增加”;虽然GTX1050的Ti和非Ti版本很少有例外,但在定价上没有什么差别。

也许前代GTX1080Ti太热了,老黄想通过“Ti”的名声“欺骗”一波,但从根本上说,RTX2080Ti定位不再是简单的升级,而是一款旗舰产品,完全可以取代原来的“泰坦”系列地位。 也许老黄也意识到,“Ti”的代言已经改变了味道,所以从次年开始,小升级的显卡都以“超级”命名”。

RTX30系列:现实升级

RTX 30 时代开启,聊聊“刀法”、看看未来

在今年的30系列显卡中,黄添加了足够的旗舰卡RTX3090,第一次,CUDA核心数量超过1万,24GB内存与前一代泰坦卡一致,与RTX308010G的内存打开了很长的距离。 个人猜测是,黄可能会觉得这么大的差距,如果命名为3080Ti将是不合格的,掩盖其真正的能力水平,而泰坦的名字将保留为更大的卡,然后出现,所以他移出尘土飞扬的“90”命名它。 你知道,一个“90”显卡或著名的“690战术核显卡”——GTX690。 另外两个显卡RTX3080和RTX3070的发布也是真诚的,其中3070在参数上有2080的力,8GB的内存,CUDA核心的数量是Ti的两倍以上。 2080

虽然现在还没有跑分结果,但是根据现有的数据分析,考虑到核心数、显存技术的“大跃进”,这两款显卡仍将符合以往“越级打怪”的规律,并且会以更大的优势超越上一代高一档的显卡,RTX 3070 完全可能“越两级”干掉 RTX 2080 Ti。

30 系列引发的一些思考

全新发布的新产品开启了RTX新时代,也与作者一起对英伟达的一些技术栈,产品线的一些思考,包括个人多年使用英伟达显卡产品的部分感想,仅供各位读者参考:

NVLink阈值逐年增加

NVLink是由Aviva开发的一种高性能计算解决方案,用于CPU和GPU之间的点对点数据传输,实现多次交换。 在这里,我们将显卡与计算机进行了比较,因此NVLink(包括早期的NVIDIASLI技术)是将这些计算机连接到高级通信网络上,实现了多卡协作在计算任务分配中的功能。 随着NVLink的升级,通信带宽越来越大,显卡的工作方式越来越灵活,但Aviva使用NVLink的门槛正在上升,今年从1070年到2080年到3090年。

RTX 30 时代开启,聊聊“刀法”、看看未来

事实上,对于大多数家庭用户来说,多通道显卡并不是必要的,至少在需要玩游戏的时候,单卡的性能和兼容性仍然是最好的。 但是对于工作站和实验室来说,NVLink将是实现更多计算核心和更大内存的好方法。 在未来的NVLink中,NVLink是真正区分家庭游戏图形卡和工作实验室卡的标准。

泰坦去哪里

泰坦最初的目标是工作站计算机,但在从1080P到4K的过渡中,它实际上占了家庭计算机市场的相当一部分。 相比之下,泰坦RTX是24GB的超级内存和$2500的超高价格,几乎完全脱离了家庭旗舰显卡的定位,真正成为工作站和实验室的配置。 今年RTX30系列泰坦显卡还没有发布,但RTX3090的性能和价格已经达到了一个曾经只属于泰坦的位置。

RTX 30 时代开启,聊聊“刀法”、看看未来

个人猜测是:老黄今年可能推出新一代泰坦卡,它可能有48GB的内存,价格可能仍然在2500-3000$左右;当然,泰坦这条产品线可能会被切断,RTX3090是一个真正的泰坦,毕竟,更重要的是,如果它是48GB的内存和更多的CUDA核心,一个NVLink串的两个3090,这将花费$3,000;在这一点上,泰坦的生活空间窄,加上泰坦现在完全超出了线定价,老黄也应该把它踢出游戏卡定位GeForce,进入专业卡的行列。

射线追踪的日益普及

事实上,对于原来的RTX20系列增加了光跟踪功能,作者有点出乎意料。 为了使光线和阴影更加引人注目和真实,RTX硬件射线追踪只是许多技术类型之一,可以在没有特殊硬件的情况下从软件层面模拟它;添加射线追踪模块有一些对用户需求的影响,例如苹果作为行业领导者的主导作用,消除了3.5毫米耳机接口,为手机用户创造了无线耳机的需求,而不是“自然规则”,而是成功的“人工干预“。

同样,基于特殊硬件模块和AI算法的RTX射线跟踪确实使游戏更加现实,但用户会付出这么多来支持Nvidia制定新的标准吗?

因此,从Aviva的角度来看,为了将RTX射线追踪远远不是必然发展成为一个行业生态标准,我们不仅需要努力工作,还需要与游戏开发人员结合,使开发团队产生适合RTX的内容。 不断地这样,在RTX显卡具有“独家特效”的游戏中,在增加自己的卖点的同时,也可能带动RTX显卡的销售,使英威和开发商得到他们所需要的,实现双赢,这是“主机独家游戏”商法的同样精彩。

RTX 30 时代开启,聊聊“刀法”、看看未来

RTX 30 时代开启,聊聊“刀法”、看看未来

刚刚发布的RTX20,只有少数原生支持RTX的射线追踪游戏,用户也可能希望更好的帧数,图片质量和积极选择“RTXoff”;Avida自己新上市的RTX也可能更有罪,为了防止用户购买,还推出了一款16系列没有射线追踪的显卡。

为了给RTX“第一护航”,英伟达当时推出了购买RTX发送“战场5(战场V)”的折扣,希望更多的用户能够高保真地访问他们的新光跟踪技术,传递良好的第一印象,开始建立对RTX的依赖;今年,当RTX变得越来越强大时,在英伟达和更多大牌游戏制造商的合作下,大量支持RTX光跟踪,不同类型的游戏涌入,英伟达领导的这种光跟踪生态变得更加成型,我相信RTX30系列的到来可以更真实地巩固生态基础。

结语

最后,我想得出结论,RTX20系列作为英伟达第一代硬件射线追踪产品,有一个更有意义的探索。 诚信发布的RTX30系列显然要成熟得多,升级范围相当可观。 新一代射线追踪核心和整体性能提升,将为用户带来更好的体验。

RTX 30 时代开启,聊聊“刀法”、看看未来

英伟达的迈进也必然与AMD的竞争压力密不可分——AMD是其注定的竞争对手之一,AMD今年还没有这样做,它将在年底带来一张新的显卡和一个新的架构。 虽然高端市场被英伟达占领,但AMD仍被价格优势,良好的能源管理,占据了相当大的中高端市场份额。

上一家“牙膏挤”厂被AMD一反,蹭到地上,英伟达就率先闯祸,开启了安全防杀距离,但“红绿”势力的兴衰将持续,这样的良性锯将继续给用户带来红利。 我们继续看。

(图片来自互联网,图表是自制的)