MCPLive > 杂志文章 > 真实游戏的测试方法与结论探讨

真实游戏的测试方法与结论探讨

2009-07-06微型计算机评测室《微型计算机》2009年6月上

如何衡量一个平台的3D游戏性能?以往我们常采用的是“专业测试软件+真实游戏跑分”的方法,通过判断分数高低或者平均帧率的方式得出结论。这样的方法有一定的科学性,结论也值得参考。但是,今天我们要讨论的话题是“苛求真实”,如何大可能地接近真实应用的测试。

如果要衡量一套系统的3D游戏性能,我们往往采用基准性能测试和游戏测试的方法,分数高或者平均帧率高的系统,3D游戏性能则越强。这样的方法很准确和直观,只需要对比后的数据就能够知道3D游戏性能谁高谁低。但是,为什么仍有用户抱怨按照评测结论购买的平台并不能胜任相应的游戏呢?这是因为传统的DEMO测试方法和实际游戏中的表现存在差异的原因,而我们今天就来探讨这个问题。

3D游戏的流畅标准是以电影帧率24fps作为参考值的,如果一旦低于24fps,就会有明显的停顿感觉,认为运行不流畅。3D负载加大,显卡不能及时处理数据,帧率低于24fps,玩家就会觉得画面出现“卡”的现象。但是24fps以上也会有明显的流畅度差别。我们曾经做过一次调查,大约60%的玩家会对24fps以下的帧率敏感,而40%的玩家会对40fps以下的帧率比较敏感,即使帧率在24fps以上也能感受到差别,40fps以上就很难感觉到各平台的性能优劣了。

影响游戏体验的关键是什么?

通常是以平均帧率考察游戏性能,只要平均帧率接近30fps就可以保证大部分时间帧率在24fps以上,就视为“可流畅运行”的游戏。然而,真实的情况真是如此吗?

我们用某平台运行《极品飞车12》时的帧率变化曲线为例进行分析。可以看到,在车辆起步时由于车辆很多,所以帧率较低(在24fps以下),在擦挂和撞车时的帧率低跌到了4fps。这个时候正是超越的关键时间,帧率太低会严重影响操作。而在跑到第一位之后,由于画面前方的其它车辆减少,帧率才逐渐上升变得流畅。而其后在撞车、拐弯(场景快速切换)时,画面的帧率也会显著降低。后,测试结果平均帧率为27.2fps,满足了流畅的低要求,但是玩家的实际游戏体验是比较糟糕的。这就好比“木桶理论”,装水的容量取决于低那块板,而不是高或者平均。同样,通过《微型计算机》大量的测试发现游戏体验的好坏也与低帧率出现的次数和时间息息相关,而不是平均和高帧率。

将此理论应用到一些对比测试中,我们用A平台和B平台来举例,向大家说明为什么要“注重游戏体验”。按照传统的测试方法,A平台在游戏中的平均帧率是40fps,B平台的平均帧率是45fps,得出的测试结论是B平台性能强于A平台。但是在整个测试过程中,A平台的低帧率都在24fps以上,而B平台有两次掉落在24fps流畅及格线以下。所以,在真实的游戏体验中玩家反而会感觉B平台出现了两次卡住的现象,认为B平台的性能弱于A平台。所以,平均帧数不等于真实体验,关键要看低帧数。

DEMO测试存在的问题

在以前的显卡测试中,微型计算机评测室也一直在关注低帧这个测试数据,我们发现之前的游戏测试大多数是用测试工具和事先录制好的DEMO测试的。DEMO测试的好处是保证游戏在测试时的可重复性,避免每次在测试时出现人为操作或行驶路径上的误差。但是DEMO和实际的游戏表现可能仍存在差别。

有些游戏开发者在制作DEMO的时候,想达到展示游戏效果的目的,所以DEMO尽量选取场景复杂和特效众多的片段,造成DEMO负载远高于实际游戏。而有些游戏开发者只是制作一个“能让所有显卡都跑出不错成绩”的工具,因此DEMO非常简单。这样一来,就造成了测试结果和游戏实际运行结果不一致的情况。因此,DEMO测试并不能代表真实的游戏体验,不同的DEMO测试结果也可能高低各不同。我们将在后面的测试中验证这个问题。

我们的测试方法

这次测试我们全部运行实际的游戏,并借助FRAPS工具记录下整个游戏过程的帧率变化。我们尽量保证每次测试时用相同的路线、场景和时间,后画出整个游戏过程中的帧率变化曲线。同时,每款游戏我们也按照传统的DEMO测试方法测试出对应的数据,用于对比实际游戏中的测试结果。

测试平台

我们选取了性能接近的两个平台,平台一和平台二除了显卡不同之外,其它配置一致,使用
Core i7 920处理器防止处理器成为性能瓶颈。两个平台主要考察中端显卡在不同游戏中的帧率变化情况,然后对比表格中的DEMO测试结果。本次测试不是为了对比平台性能,而是考察各自平台在实际游戏中的帧率变化和DEMO测试时的差异。

 

 平台一

 平台二

 处理器

 Core i7 920

 Core i7 920

 主板

 华硕Rampage Ⅱ Gene

 华硕Rampage Ⅱ Gene

 内存

 金邦DDR3 1333 2GB×3

 金邦DDR3 1333 2GB×3

 显卡

 蓝宝石Radeon HD 4830(640sp)

 索泰GeForce 9800 GT

 硬盘

 日立1TB

 日立1TB

 电源

 航嘉多核DH6

 航嘉多核DH6

《汤姆克兰西:鹰击长空》

《汤姆克兰西:鹰击长空》是一款DirectX 10.1的空战题材游戏,平台二的NVIDIA显卡无法在游戏中打开DirectX 10.1选项。这款游戏大量采用了高等级DirectX 10特效,如体积云、体积光等,如果显卡支持DirectX 10.1,会在高画质下获得一定的性能提升。

 DEMO测试结果

 1920×1080

 平台一

 平台二

 平均帧率

 36

 38

 大帧率

 142

 146

 1680×1050

 

 

 平均帧率

 43

 42

 大帧率

 156

 158

游戏中附带了测试工具,可以直接对显卡性能进行测试。测试场景是在城市上方的空战,飞机不停地在云雾中穿梭,在穿过云雾以及发生大爆炸时,帧率会有明显的下降。


平台一


平台二

实际游戏运行时,如果飞机视角中大部分是天空,fps能够达到50帧以上,而在城市上空,以及穿过烟雾时就会有明显的帧率下降。从平台一和平台二的对比中可以看出来,支持DriceX 10.1的显卡会在面对复杂特效时进行辅助计算,帧率波动范围在20帧左右,而平台二的GeForce 9800 GT显卡的波动范围则达到了40帧以上。当分辨率提升到全高清的1920×1080之后,Radeon HD 4830显卡的波动幅度也要小一些。平台二的高帧率在两个分辨率中要更高,低分辨率也要更低,还好都能够保证流畅的运行。

测试分析:《汤姆克兰西:鹰击长空》在实际游戏中对显卡的要求明显要低于测试DEMO,这主要是因为测试DEMO加入了许多能够展示游戏佳效果的特效,场景也更复杂,所以这四个平台在实际游戏中的表现都要高于测试DEMO中的成绩。

《孤岛危机2》

这是一款到目前为止我们认为画质逼真的游戏,除了表面材质的渲染逼真外,游戏中的光影处理也是非常到位的。阳光从树叶缝隙里透过后洒在地面上,光影的轮廓自然,还会随着树枝的摆动而晃动。游戏中也加入了物理特效,树枝可以用枪打断、地面的砂石会随着枪弹飞溅。

 DEMO测试结果

 1920×1080

 平台一

 平台二

 平均帧率

 31.4

 25.77

 大帧率

 51.62

 43.25

 小帧率

 21.6

 20.06

 1680×1050

 

 

 平均帧率

 35.08

 28.29

 大帧率

 68.71

 43.21

 小帧率

 25.67

 22.17

我们首先分析一下DEMO的测试结果,高画质对于这两个平台来说运行起来还比较困难,它们的平均帧率大部分在30fps左右,而且低帧率在24fps以下,运行起来不流畅。但是真实游戏中我们所测得的平均帧率更高一些,几乎都达到了流畅的标准,平均帧率超过30fps。而且,在这个游戏中发生了我们文章开头所描绘的案例中的情况。


平台一


平台二

在1920×1080分辨率的测试里,平台一的平均帧率低于平台二,平台一为36fps,平台二为
40fps。但是在帧率曲线的变化过程中,平台二发生了两次帧率严重下降的情况,在60秒和136秒时分别低到了20fps和21fps,明显形成了两次画面停顿的感觉。

测试分析:《孤岛危机2》在实际的游戏中的运行流畅度要略高于DEMO,平均帧率超过
30fps。并且有趣的是,按照以往的评测方法,我们会认为平台二性能强于平台一,平台二的平均帧率高于平台一。但是在帧率曲线的变化过程中,平台二发生了两次帧率严重下降的情况,平台二的实际游戏体验会弱于平台一。

《英雄连:抵抗前线》

《英雄连:抵抗前线》这款游戏加入了很多物理特效,比如炸弹爆炸时,泥土和建筑物的残骸会四处飞溅,效果非常逼真,因此对显卡的性能要求非常高。两个平台都被系统判定为极好,平均帧率达到了40fps以上,在整个过程中只有一个场景的帧率会降低。

 DEMO测试结果

 1920×1080

 平台一

 平台二

 平均帧率

 42.1

 38.4

 大帧率

 62.5

 60

 小帧率

 19.5

 19.9

 1680×1050

 

 

 平均帧率

 47.2

 44.8

 大帧率

 60.8

 61.3

 小帧率

 26.6

 27.5

我们以第一个平台举例,1920×1080分辨率下,使用DEMO测试的平均帧率为42.1fps,低帧为19.5fps,得出的成绩评价是极好。也就是说,Core i7 920处理器+Radoen HD 4830显卡应该能够满足《英雄连:抵抗前线》流畅运行的需求。但是在真实游戏里,这个平台的成绩非常不理想,大部分时间的帧率都低于30fps。


平台一


平台二

虽然曲线在中间也达到了一次60fps,但那是因为画面出现了任务提示,出现的黑屏切换。每次出现炸弹爆炸的情景时,画面都会发生停顿,明显低于24帧。而且我们测试时使用的是任务模式,画面中的作战单位较少,如果是在对战模式,敌我双方大量坦克狭路相逢时,此时的画面会像幻灯片一样。降低分辨率到1680×1050之后,两个平台的成绩仍然不高,帧率在20fps~30fps之间,因此我们建议中低端用户在玩这个游戏时尽量关闭一些特效,保证画面的流畅。

测试分析:《英雄连:抵抗前线》用于测试的DEMO是一段动画,而不是真实的游戏场景,所以DEMO的测试结果和实际游戏的差别较大。它的测试情况和《孤岛危机2》相反,实际游戏的帧率要远远低于DEMO的测试结果。

《孤岛惊魂》

这款游戏对硬件的要求非常高,以至于在高画质下,平台一这样的配置也无法达到24fps以上的平均帧率。因此在这个游戏的画质设定中,我们没有选择Ultra High,而是选择的High。但就算是降低画质,这款游戏的流畅运行对这两个平台来说还是比较困难,它们的平均帧率大部分在30fps以下,特别是1920×1080分辨率时平均帧率基本接近24fps,也就意味着大部分时间的帧率会掉落
24fps以下,运行起来并不是流畅。

 DEMO测试结果

 1920×1080

 平台一

 平台二

 平均帧率

 25.18

 28.56

 大帧率

 30.7

 33.92

 小帧率

 19.21

 19.7

 1680×1050

 

 

 平均帧率

 28.87

 32.87

 大帧率

 35.19

 39.65

 小帧率

 19.05

 23.93

在实际游戏的测试中,帧率和DEMO的测试结果相同,也只能在20~25fps之间变化。这两个平台的帧率曲线基本是前半段集中在20~25fps之间,后半段集中在17~20fps。


平台一


平台二

前半段是正常的游戏内容,虽然帧率不高,但是感觉还比较流畅。后半段是一段动画,帧率平均降低了7fps,就显得不流畅了。这两个平台之间的曲线波动几乎保持了一致,和DEMO帧率的测试结果吻合。

测试分析:《孤岛惊魂》测试DEMO较真实地反应了平台在游戏中的实际表现,而且也是一款对显卡性能要求非常高的游戏。

《使命召唤5:世界战争》

《使命召唤5:世界战争》是一款以二战为题材的第一人称射击游戏,它沿用了上一代《使命召唤4:现代战争》的游戏引擎。这款游戏没有测试DEMO,因此只能通过FRAPS软件记录帧率。


平台一


平台二

由于这款游戏还只是一款DirecetX 9游戏,所以对系统的性能要求并不高,两个平台都可以流畅地运行,平台一的帧率范围在40fps~60fps之间,平台二的帧率范围在50~70fps之间,虽然有一定的性能差距,但是游戏体验都很流畅。

测试分析:这款游戏的游戏体验在四个平台中都表现得很好,运行流畅。两个平台不存在高低之分,人眼是无法区分出几个平台的性能差异的。

总结

良好的游戏体验有两个方面,第一是流畅的画面,第二是精美的画质。根据我们的测试体验,如果游戏中平均帧率在25fps左右,会经常出现低于20fps的情况,这样的游戏体验是不及格的,我们会经常感受到画面“卡”住,甚至影响到操作。如果平均帧率达到了30fps以上,偶尔出现帧率掉落在24fps之下,但不低于20fps,这样的游戏体验基本合格。如果平均帧率在40fps以上,完全不会低于24fps,那么这样的游戏体验就是优秀。

1.真实的游戏体验取决于帧率曲线

我们前面描述的A平台和B平台的情况的确在《孤岛危机2》中出现了。大多数情况下,仍然是平均帧率高的平台,帧率曲线整个水平都较高。所以,平均帧率的数据还是能够一定程度上反映平台的3D性能的,但是并不精准和绝对,如果能得出帧率曲线进行分析,才是科学的。

2.用DEMO测试游戏和实际游戏是两回事

五个游戏中,《英雄连》、《鹰击长空》和《孤岛危机2》三个游戏的DEMO测试成绩和实际游戏成绩有较大出入,它们之间的成绩有高有低。所以,用测试DEMO来衡量平台在游戏中的体验并不完全准确。特别是《英雄连》,DEMO测试结果表示两个平台性能满足流畅运行的需要,实际结果却经常“卡”住。不过,我们并不是否定DEMO测试和基准软件测试的价值,它们是测试中必不可少的工具,尤其在衡量处理器、显卡、系统的性能差异时。只是强调对游戏测试而言,实际的体验并不能等于分数。

用一个画质或采取默认设置(对所有配置、所有平台一视同仁),这样的评测方法并不恰当,因为不同游戏、不同平台的性能都不一样。就好比你不能用同样一段路,去评测所有的汽车,看谁跑得更快。而是应该设计“市区、郊外、赛道”等不同路况,去适应“家用车、
SUV、跑车”的不同需求。

多年来,MC一直不断更新和改善测试方法和工具,以适应不同时期不同硬件的测试需要,但有一个主旨不变:尽大可能追求真实应用的体验,这样对玩家来说才具有指导意义。对于游戏而言,我们认为真实的结论应该是在保证游戏“流畅”的前提下,大可能地提高画质,在“速度与画质的临界点”得出的测试数据才有说服力和参考性。因为这才是游戏玩家的真实初衷,即让投入的资金大限度发挥价值。

本次测试的目的是为了探讨DEMO测试和用真实游戏测试的性能差异,实际游戏测试缺乏可重复性和准确性,受人为影响较大。但是这样的测试结果对系统在真实游戏里面的表现仍有较大的参考价值。所以,在今后的游戏测试中,MC评测室将根据需要采用DEMO和游戏实际考察两种方法,这样才能得到对用户来说更具参考价值的测试数据。

分享到:

用户评论

共有评论(3)

用户名:

密码: