csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

编辑:其实这是几个月前的PPT演讲。在GDC 2018中,Valve游戏工程师John McDonald在度假史中介绍了通过深度学习提高CSGO用户游戏体验的尝试。这不是“认证开废行为”,而是“提高用户体验”,原因是V社这次不仅将AI技术用于防止作弊机制,还对普通玩家心理进行了彻底的研究。

csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

2018年1月Steam游戏数前三

挂在CSGO上的CSGO(中文名字《反恐精英:全球攻势》)是2012年V公司推出的第一人称射击队比赛游戏,是CS系列的第四部作品,6年来备受国内外选手欢迎。作为FPS游戏,玩家恶意悬挂几乎是不可避免的,但与上图中排在第一位的PUBG相比,CSGO的悬挂并不多到令人信服的程度。

但是有玩家的话会生气,生气的话会抱怨,用脚投票。

据John McDonald透露,目前CSGO的月生人数为1240万人,平均每天约300万人,团队时间平均为1-2秒。对于上市6年的游戏,要保持这种数据并保持Steam排行榜前三名的稳定并不容易。这离不开开发团队为玩家创造的游戏环境。

但是2016年,V公司收到压倒性玩家的投诉,很多人通过电子邮件、发布Reddit等方式提起诉讼。你们的游戏很悬。面对玩家的愤怒和无法尽快戒掉的棘手情况时,V社有点困惑。

csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

透视

csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

锁上锁

CSGO是V公司自己开发的游戏,具有官方VAC系统,可以对offer实施有效的封锁3354,但热门游戏的背后总是伴随着经济利益。很多人为VAC开发很多可以绕过监视的悬挂,或者在V公司喜欢事后结算的风格上找到漏洞,不仅抢走玩侥幸的玩家的账号,还破坏正常比赛的玩家的游戏体验。

今天,很多人在玩CSGO的时候,不忘去掉“挂太多”,重点批评。爱情是深刻的,迫切需要责任感。他们对游戏的爱是真实的,但他们对插件的恨也深入骨髓。无奈的现实是,制作CSGO插件的成本很低。如果有人当初保持《半条命2》的插件,他会发现这个悬挂在CSGO也能继续生效。

CSGO和深度学习2015年,CSGO的Overwatch正式上线。我真的没有笑),这是监督功能。被判定为作弊的选手可以查看被怀疑为作弊的选手的Demo,判断是否作弊或调整游戏参数。如果玩家发现有开闭行为,可以将Demo提交给协调员进行进一步审查,之后当局将采取后续行动并反馈结果。

Overwatch本身可以初步判断玩家是否打开,其背后的算法是朴素的Bayes。系统首先找到开口的阈值,然后对结果进行分类。但是,实践证明,这种朴素的基于威尼斯的系统过于宽容,只能识别非常明显的开闭行为,并将大部分陷入微妙的Demo——网的鱼反馈给实物。(威廉莎士比亚,《北方执行》(Northern Exposure))。

对玩家来说,Overwatch可能是鸡肋,但在深度学习的眼里,这一数据成为了非常罕见的数据源。(威廉莎士比亚,北上广深)。

模型简介

V公司开发的反欺诈深度学习系统称为VACnet。设计为140个阶段的GRU RNN,由输入层(256个神经元)和4个隐藏层(每层256个神经元)组成,用于序列处理。网络使用的激活函数是ReLU,损失函数是二进制交叉熵,优化算法是Adagrad。

VACnet是一组大规模的优质数据集,包括播放器从Overwatch收集的数据中提供的内容和正式收集的内容。现在也有通过深度学习生成数据的方法,但这种方法容易使用神经网络,所以开发者们使用的是实际的游戏Demo。(威廉莎士比亚,北上广深)。

模型的输入不是一般的长向量。在这里,使用140次射击作为一个序列,依次记录每个视频帧的所有信息。这些输入称为(X,y)。其中X是我们常说的特征,包括使用了什么武器,射击的结果,目标相距多远,调整瞄准角所需的时间等。最后,模型需要反复验证学习质量,直到匹配X数据并输出最佳结果。

推断和硬件

训练结束后,将用于推断(供应)模型。

John McDonald将这个过程比作牛肉汉堡的制作。当开发者面对Overwatch时,他们手里没有现成的牛肉肉泥,而是不断吃草和长胖的牛。为了将数据用于深度学习模型,开发人员花费95%的时间和精力将牛切成牛肉3354数据,剩下的1%用于牛肉3354深度学习,4%用于制作汉堡包3354训练模型。

csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

据悉,v社平均每天收集60万场比赛,每场比赛4分钟,共240万分钟CPU时间(一天)。但是每天只有1440分钟,这意味着为了实现目标,至少需要购买1700个GPU。这时,玩家们献给G肥胖的祭品开始起作用,——他们共购买了3456个CPU。下图是处理器的冰山一角,每个处理器包含54个CPU核心和128GB RAM,仅用于估算型号。

csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

根据V社此前制定的防止作弊逻辑,玩家举报——协调员审查——玩家认为3354没有打开或打开,目前有VACnet,因此举报过程中又增加了一个“VACnet举报”。据悉,在所有申报中,玩家申报的开合确认率为15%至30%,种类非常丰富。VACnet的开合确认率达到85% ~ 90%,但种类相对单一。

效果评价

如上所述,VACnet的效果令人满意。尽管缺乏灵活性和通用性,但至少找到了大部分挂着的人的“罪证”。如下图所示,首次加入游戏反欺诈机制时,小幅增加系统检测开闭数,添加更多教育数据后,2018年前后又形成了激增的最高值。而且,从实际应用的角度来看,VACnet从来没有一起误判过作弊事件。当然,最后的现实检查也起到了重要作用。

csgo卡盟_V社:用深度学习检测CSGO中的开挂行为

从用户反馈来看,这种深度学习尝试也取得了前所未有的成功。他抱怨说,引入Overwatch和VACnet后,在Reddit开放的CSGO播放器数量大幅减少,仅占2016年高峰时间的1%。这种情况将有助于老玩家的存续和新玩家的进驻,也是V社高兴的消息。

但是VACnet真的很完美吗?其实并不总是这样。除了上面提到的以外,似乎只能认识到某些种类的开闭行为,还有更严重的缺点。训练时,在完成“申报——协调员审查——播放器判定3354开/未开”过程后,为了确保模型的学习效果,被判定为真实的数据将再次提供给模型进行学习。

这提出了一个问题。如果有人开发悬挂,前几枪的自我描述、锁、最后几枪就能恢复正常。系统应该如何判断?(大卫亚设,Northern Exposure(美国电视剧),如果是真正的裁判,他会认为EMM,这东西有问题,肯定会挂掉。但是机器不知道这种判断的依据,只能把它标记为开放,然后在开放的时间和未开放的时间里强行学习。(威廉莎士比亚、坦普林、机器) (这可能会降低模型性能。

为了解决这个问题,目前V社发现的治疗方法是添加自动再教育功能,以修复启发式算法引起的漏洞。(威廉莎士比亚,Northern Exposure(美国电视),成功)第二个是创造新的不成熟模型,扩大开放动作检测范围,增加系统能够识别的开放种类。三是将VACnet应用于其他steam游戏,追求一般化。

摘要John McDonald认为深度学习是改革传统反作弊方式的新兴技术。v社目前将深度学习用于半开墙、作弊、选择dota 2英雄等,其中最引人注目的是dota 2的“大教师”。

目前,为了开发对抗VACnet的工具,不必担心使用深度学习技术的人。因为v社手里掌握着别人无法想象的游戏数据。毫无疑问,为了深入学习,数据越多,模型性能越好。唯一需要担心的是,用于训练的这组数据是在比赛中收集的,有人会恶意污染数据。这个人似乎一眼就能知道是否打开了门,但如果能用插件欺骗玩家,可能会欺骗VACnet,妨碍训练和学习。

从整个演讲来看,我们可以得出结论,VACnet是有效的,但其防止作弊的能力并不像我们想象的那么突出,插件也不能完全卸载。(约翰肯尼迪,Northern Exposure(美国电视),)如果反作弊系统不能分辨玩家是否作弊,那开发者实际上并没有决心消除插件,只是关心玩家的游戏体验。(威廉莎士比亚、哈姆雷特、不正当行为、不正当行为、不正当行为、不正当行为、不正当行为)。

实际上,这也是VACnet成功的地方。立即减少投诉员额数量,稳定玩家的心态,使CSGO占据选手活动名单前三名。当玩家再次谈论游戏的开闭行为时,他们将乐于讨论V社防止作弊的努力,并称赞深度学习的实际效果。

对普通玩家来说,这样的结果是快乐还是担忧?

    • 2会员总数(位)
    • 4266资源总数(个)
    • 7本周发布(个)
    • 0 今日发布(个)
    • 1523稳定运行(天)

    365卡盟提供最优质的游戏辅助