基于标签化加权计算的游戏评分机制

老实说我觉得现在的游戏评分没有用。
你最喜爱的游戏获得了IGN10分,你很高兴,你恨不得给你每个朋友分享你的喜好的时候都带一句“这个游戏IGN满分”。
但是,如果是8分呢?推荐一款游戏的时候,如果你说IGN8分,或者Metacritic75分,这句描述似乎不痛不痒。人们对于8分的游戏不再关注的是8这个数字,而是扣掉的分扣在了哪里,你会记得IGN有一个too much water,但你不一定记得那款宝可梦的得分是7.8。
噢你可能看过相关的梗图所以你记住了这个数字。
但是对于这个评分来说,7.8和7.9的区别在哪里呢?7.8可能是多位编辑评分的结果,但一你不认识那些人,二来还是就那几个人自己评下来的分数,其结果是7.8还是8.0的区别并不大。
我想强调的是,现有的游戏评分能够存在必然具有价值,可是分数本身的意义越发不明显。以前的游戏种类少,评分主要依赖在杂志上发布,因此当时的游戏评分比如fami通的分数就会更有参考性一点。但现在游戏种类显著变多,而游戏媒体也要追求多元化,因而评分标准不明,评分的参考价值也不高,人们更多关注的是提前玩到的那些编辑,或者是不是编辑都无所谓,他们反馈出来的游戏的优缺点。
当然他们说的优缺点也不可靠,总是有游戏口口声声说很好但实际玩起来很无聊。
现在的分数太没有营养了,表现出的是无法适应市场环境、无法均衡多方意见、以及无法对玩家提供反馈。于是我就在想,我提出一个更好用的评分方法怎么样?
当然我不是什么业内,我啥也不是,但是我会提出自己的意见。我提出的方案重视的是游戏社区的看法,默认玩家会自觉的将游戏分类看待,以这个基础进行的思考。如果出现游戏形式小众或者内容太复合的情况,可能不适用于这个评价系统。
首要要思考的是现在的游戏评分的意义和优势在哪里。首先我们还是回到too much water,为什么这个短语让人印象深刻,正是因为这是这个描述是能提前玩到游戏的媒体对游戏缺点的概括。游戏评分除了被小部分人拿来比来比去之外,更主要的作用是作为购物的参考指南。几个准确的概括优缺点的词几乎就是游戏评测的全部,其他的全部话语都是为了描述这几个词的表现,甚至连分数也被评价词的光芒盖过去了。知道这一点,缺点方面就比较明了了。too much water之所以那么出名,正是宝可梦社区的玩家看到后对IGN表达了亲切友好的态度,并制作了大量梗图流传。现在的游戏评测离社区太远了,远到哪怕一个只是离游戏社区关系近一点的主播,他们的游戏评价都会比游戏媒体的评价要有参考价值。因此我认为要汲取优点,把评价词和游戏社区放在优先级,通过这两者产生游戏评分,并以此设计了一个机制。
在一个游戏发售之后,评分系统先预留一周的时间让玩家熟悉这款游戏,并给出评价。可以使用ai或者人工检视,选出评价里面的优点和缺点关键词,并把每一点都列出来。这些评价词的选择必须做到异化和明确,异化体现在不能选出来是“剧情引人入胜”或者“具有挑战性”,而应该是“剧情角色塑造完整”和“挑战性的平台跳跃”这种有独特含义的点。明确体现在词义和描述的概念要明确,你给黑暗之魂加一个“恋爱游戏”的标签或许在steam上看起来很有趣,但是在游戏评分里很无厘头。在概括出数个优缺点后,比如说各概括出十几个优点和十几个缺点后,让社区进行投票,每人可以投两项,最终选出五个得票数最高的优点和五个得票数最高的缺点。这种做法一方面是可以避免出现too much water这种不明所以的评价词,通过ai分析游戏评论,可以获得对游戏的特点描述的最准确的评价词,而且人工筛查能避免一些误导性的描述。这种投票是永久性的,如果一款游戏比如说《无人深空》在发售后评价发生改变,玩家可以添加新的评价词,并使用投票让新的词出现在评价系统中。任何因为玩家恶搞或者因为版本更新而变得不合适的评价词可以发起移除,随后返还对应的投票次数,让社区可以随时根据游戏的情况进行调整。这样子产生的游戏评测不仅完全符合玩家的立场,而且也能很很弹性。
最关键的是这种方式很有抵抗力。假设一个主播因为不满意新一作宝可梦里去掉了自己喜欢的那一只,他鼓动粉丝去在缺点一栏里把“缺乏一些过去的宝可梦”给投票投上来了。其他第一次接触这款宝可梦的玩家看这个评价词也会明白,这个缺点可能对系列老玩家来说更敏感,而新玩家可能并不在乎,直接无视了这个最大的“缺点”,也就能让游戏评价更客观。而且通过将描述游戏剧情或者玩法的评价词进行规范化,比如说“挑战性的平台跳跃”,如果一个玩家遇到不知道玩什么的时候,可以去搜这个评价词获得所有带有这个评价词的游戏,而且还可以根据不同游戏的这项评价的得票数倒序排列来了解同类型的游戏。
而有些观众可能注意到了,那评分呢,说好的评分呢?在这里我就要讲一讲我的视频标题是什么含义了。我们对优缺点进行加权,比如说优点的得票从高到底排列,再接上缺点从高到低排列,对每一项的按照顺序进行赋分,并根据得票数进行加权,最后算出来一个分数。这种计算方法哪怕出现评价词顺序更迭也能够稳定运行,毕竟一个新的词也是要从排名下面通过投票挤到前五名是一个线性的过程,除非删除排名前五的词不然不会出现分数的跳跃。删除词的系统可以参照百科的编写方式,允许社区中活跃等级足够的人去编辑,如果遇到争议词还可以申请锁定,由管理员去处理。这种加权评分的最大意义在于这个得分是有意义的,虽然还是会存在某个游戏仅仅因为自身的剧情太好结果得分超过了另一款综合起来更好的游戏,但是当你去看优缺点排列以及得票数的时候会非常清晰知道这个分是怎么来的。
总的来说,我认为我提出的这个方案虽然有一些缺点,比如不能在游戏刚发售的时候就可以提供购买建议,但它能很好符合社区类玩家的需要。最重要的是,这个系统是最适合放在每个游戏社区里的,如果用来很广泛的分析游戏可能效果不好。但是假如说放在一个rpg游戏论坛里,那么这种体系对于玩家之间交流游戏会很有用,玩家用来推荐游戏的时候也会非常明确。