近日,新浪微博的服务器又经受了一次考验。日前,演员文章和马伊琍在微博宣布离婚,随即微博流量短时间内出现暴增。早前,在鹿晗、冯绍峰等明星“官宣”喜讯时,微博曾出现过服务器宕机事件,因此也有人担心此次离婚消息发布是否会再次引发宕机事件。
那么,究竟什么是宕机?引发宕机的原因又是什么?就上述问题,科技日报记者采访了相关专家。
预防宕机不存在太大技术问题
实际上,宕机是IT行业术语,宕为英文down的音译。所谓宕机,是指网络空间的信息系统无法提供正常服务,出现卡顿甚至“停摆”现象,用户的直接体验就是系统长时间无响应,比如无法正常访问、搜索无响应、无法发帖等。
“造成系统宕机的因素有很多,比如机房供电故障、服务器硬件崩溃、系统处理能力不足、遭受网络攻击等。”北京理工大学网络攻防对抗技术研究所所长闫怀志告诉科技日报记者。
突发热点事件引发的微博服务器宕机事件,通常是由于瞬间访问量暴增,导致后台服务器不堪重负,只好“一宕了之”。资料显示,微博系统服务器的访问量上限被设计为预估平时流量的峰值,相关服务资源均依此配置。一旦突发事件导致访问量超出此峰值,系统将无法承受,宕机也就在所难免。
“单就技术层面来说,预防微博服务器宕机不存在太大问题,只要扩充容量即可。而微博服务器宕机事件频发,原因主要有两方面。”闫怀志解释道,一是微博服务器部署规模及其处理能力受限。很多公共服务平台的平时流量基本稳定,基于成本考虑,在保持适度冗余处理能力的前提下,微博运营商不会主动去租用或配置大量超出日常数据处理需求的计算和存储资源。服务器扩容多了,如果没有流量支撑,就会造成资源闲置及成本增加。另一方面,微博流量具有瞬间峰值高、持续时间短的特征,在热点事件出现时表现得更明显。微博热点流量较难预测,使得微博运营商在扩容问题上陷入两难境地:扩容多了易亏,扩容不足易挂。
平台可预测峰值流量加以应对
在闫怀志看来,热点流量虽较难以预测,但不等于不可预测。只要能预估出流量峰值范围,就可通过定时扩容和提供弹性计算存储资源来从容应对。很多平台在这方面都有过应对流量突增的成功案例,比如应对“双十一”时的峰值流量。明星离婚等网络突发事件,虽不受微博运营商控制,但微博运营商应该可通过舆情监控等手段感知即将到来的流量大潮,通过启动应急预案(比如临时租用“备勤”服务器)来应对。
“此外,微博宕机不能排除的另一个可能,这或许是某些微博运营商的营销或推广策略。”闫怀志说,因为微博宕机本身也是个突发热点,客观上会提升微博关注度。更有甚者,某些明星经纪公司在“娱乐至上、流量为王”的观念驱使下,联合微博运营商人为制造这些宕机事件来吸引公众眼球、提升明星知名度,也不是没有可能。毕竟,微博已经历了多次的宕机,理应具备相当的应对经验。再出现新的宕机事件,到底是运营商无能为力还是有意不为,有时还真要打个问号。
边缘计算、人工智能都能帮上忙
“依靠现有前沿技术,有可能避免或缓解宕机问题。”闫怀志解释道,主要的手段就是构建弹性伸缩业务系统,辅以人工智能预测和业务持续性监控,来保障峰值服务正常运行。比如,通过人工智能技术来预测网络突发流量,利用云计算弹性计算资源平台来实现快速扩容甚至实时扩容,以应对高峰流量。
据报道,商用云服务提供商目前可在宕机后数秒内探测到服务不可连接,然后在90秒内实现扩容,恢复运行中断业务。这种按需部署的服务器配置方式,既可显著降低网络平台服务器宕机的风险,又能很好地利用存储计算资源,实现双赢。
此外,闫怀志指出,还可采用“降级”运行策略,即将服务器的业务拆分为若干相对独立的业务,各业务之间共享数据库。一旦服务器出现过载,可启动降级策略来“丢卒保车”,至少保证核心业务能正常运行。比如,若微博热搜榜崩溃,可维持评论、转发等核心功能的正常运行。
“另一种有效的应对方式是利用边缘计算技术。”闫怀志说,通过在网络边缘实现数据分布式本地处理,可显著降低访问数据的汇聚和传输总量,这不仅能缩短用户响应时间、提升用户体验,还能大幅降低中心节点的数据传输和处理压力,也是一条应对宕机的新路径。
标签: