over 2 years ago - TheShaolinMonk - Direct link
与其他客户端/服务器产品一样,我们的游戏具有非常复杂的分布式基础架构,由各种不同的服务器组成。它们是授权服务器、存储用户配置文件的服务器、战斗服务器、小队服务器和语音通信服务器。所有这些都不是在一个设备上,而是在几十个设备上!另外,一个匹配的服务器,由许多入口网关的物理设备组成,作为消除故障点的代理,以及一个实际从队列中的玩家创建战斗的服务器。

现在,关于上周末发生的事情的更多细节。其中一项网关服务运行了 375 天,在计划重启期间,加载了一个配置错误的版本,该版本仅使用了一个内核(我们仅在周日才发现)并且错误地代理了 IP 地址。最初,在我们看来,由于新推出的车辆和游戏国家,以及社区对重大更新的关注,服务器似乎过载了。我们决定通过转移到亚马逊最强大和最昂贵的设备来尽快增加容量。然而,这不能立即完成,移动本身也需要时间。但即使迁移完成,配置不正确和单线程的问题仍然存在。服务器了解到所有通过此服务进入的玩家都有相同的IP,无法快速找到他们并开始滞后。格林威治标准时间晚上 9:00 左右后,错误代理的问题很快被定位并得到纠正,战斗再次开始匹配。然而,在夜间,用户数量减少了,即使代理使用单核这一事实也不会干扰操作。

周日,随着用户和战斗的增长,负载再次增加,我们终于找到了第二个配置错误,下午我们通过平滑移除配置错误的机器并引入新机器来修复单线程代理,以便避免对已经在玩游戏的用户拒绝服务。这个过程也需要一些时间。应该注意的是,即使在引入更强大的服务器之前,也有足够的容量功率可用 - 单核的功率还不够,但有很多 升级后我们只使用了大约 6%总容量(即峰值功率的 20 倍储备)。

结论
根据结果​​,我们得出结论并计划了操作和匹配代码的改进。首先,我们计划通过重新启动所有正常运行时间过长的服务器来检查服务的容错性,利用大型流媒体服务的经验,例如 Netflix,使用特殊的机器人来检查运行时间

此外,我们已经对匹配代码进行了改进,这将使我们即使在高负载下也能保持可接受的游戏运行水平 - 排队可能需要更长的时间,但服务不会停止响应玩家 - 保持运行。

此外,游戏国家数量的增加和战斗中可能的游戏配置已经达到了很大的价值,需要进行算法优化。发现所有玩家和所有游戏国家的所有可能组合是算法的二次复杂性,因此有必要进行优化以找出可能不是绝对完美的可能匹配,但至少足够好。

更多好消息。从 11 月 4 日(格林威治标准时间 11:00)到 11 月 8 日(格林威治标准时间 11:00)登录游戏即可获得高级道具,5 场战斗 +30% RP!
over 2 years ago - TheShaolinMonk - Direct link
Originally posted by SASMrSmall: English?
English was also pinned https://steamcommunity.com/app/236390/discussions/0/3158706376149394930/
over 2 years ago - Incognito - Direct link
Originally posted by ♠Gamer3106♠: Why is there a Chinese one but not a russian one?
https://steamcommunity.com/app/236390/discussions/0/3158706376149643965/
Ну как бы вот