根据 Hora a Hora 数据平台的数据,2024 年“黑色星期五”在短短 24 小时内就创下了 93.8 亿巴西雷亚尔的销售额纪录,累计订单量达 1440 万单,成为巴西电商史上最大的购物节。除了销售额的大幅增长外,这一天也带来了严峻的技术挑战:根据 FGV 电子商务年鉴的数据,55% 的零售商报告系统运行缓慢或不稳定,其中 40% 的问题归因于关键 API 故障。
持续测试和站点可靠性工程 (SRE)等实践已成为确保可用性、安全性和性能的重要工具。这些方法使我们能够在故障影响生产环境之前进行预测,自动化大规模验证,并在极端高峰情况下保持弹性。
专家Vericode直接参与了这一过程。2024 年,该公司领导了 Grupo Casas Bahia 基础设施的准备工作,以应对黑色星期五的到来,使用 K6 工具模拟 2000 万并发用户,并通过 Grafana 进行实时监控。该操作应对了每分钟高达 1500 万次请求的峰值,确保了整个购物过程的稳定性和性能。
在今年的黑色星期五,该公司预计人工智能在自动化测试和可观察性方面的应用将更加突出。基于人工智能的解决方案有望更准确地预测瓶颈,实时调整工作流程,并以更少的人力扩展测试覆盖范围,从而提高数字化运营的质量和效率。
Vericode 合伙人、软件测试和可靠性工程专家 Joab Júnior 强调了先进实践对于确保高需求时期稳定性的重要性:“只有提前准备、持续自动化和整合的 SRE 实践,才能支持数百万个并发请求。这可以降低发生严重故障的风险,确保数字体验的完整性,并保证收入。”他解释道。
除了负载测试和监控之外,Vericode 还投资了低代码测试自动化平台dott.ai。该工具可在不牺牲技术治理的情况下加速交付,即使在“黑色星期五”或高流量发布等关键时期也能确保系统稳定。
根据 Neotrust Confi 的一项调查,大型零售商的搜索端点在 2024 年达到峰值每分钟 300 万个请求。在商业日历最繁忙的时期,寻求竞争力和运营连续性的公司采用自动化管道、持续回归测试和主动可观察性已成为标准。
对于Joab Júnior,这种情况需要技术团队转变思维方式:“访问量越来越难以预测,而有效应对的唯一方法是从开发周期伊始就整合质量。这不仅意味着进行更多测试,还意味着进行更高质量的测试,包括智能化、自动化和可靠性。”