容器云 – 为电商双十一大战保驾护航

又到一年双十一,一场由电商网站主导,社会全民参与的购物狂欢盛宴再一次准时上演。事实上,双十一,不仅是剁手党们热热闹闹的「 狂欢节 」,同时也是电商网站们悄无声息的「 技术大考 」。不得不提的是,剁手党们年年狂欢,电商网站们却有着一段不堪回首的过去。

往事不要再提:

曾几何时,在剁手党们还没成长为秒杀老司机,还没有看破电商那些“先涨价再降价”的猫腻,对大促还很有新鲜劲的时候,各大电商摩拳擦掌几个月,呈现出来的大促结果却是让人大跌眼镜的宕机、宕机、宕机……

犹记得,尼玛凌晨就开始守在电脑前准备秒杀,却永远是登录失败状态。现在看来都不可能发生的“事故”,比如网站瘫痪、服务器断电、运营商链路挂掉、CDN故障、400电话不通等几乎都发生了,捂脸……

如今成功蜕变:

不过如今,当剁手党们对电商大促习以为常,习惯“6·18”、“11·11”、“12·12”等电商造节术,开始不过“光棍节”,只过双十一时,电商的技术也早已不可同日而语,神马百万级流量峰值都是浮云,电商的心态就是一个爽:「 任尔东西南北风,吾自岿然不动!」得意……

看到这里,大家肯定会好奇,电商的技术啥时候变得这么厉害了!大促不宕机,能抵挡住数倍于日常的流量洪峰的法宝究竟是什么呢?

法宝就是容器技术!容器技术!容器技术!(重要的事情说三遍!)

接下来看看各大电商巨头在容器技术应用方面的现状是怎么样的(在这么好的广告位给几位打广告,小编的内心其实是拒绝的):

京东对容器技术的使用和推崇在圈内是可圈可点的。据公开资料显示,京东拥有目前世界上 「 规模最大 」的Docker集群,今年或将达到20万个。基于Docker和OpenStack的京东弹性云,支撑了京东数次6.18和双十一大促的考验,以及数千亿的交易业务。目前京东所有的应用已经100%通过容器技术来发布。

唯品会的私有容器云管理平台,主要用于提高资源利用率,快速/自动部署多数据中心等。

唯品会数据库备份恢复容器化项目实践经验总结

蘑菇街基于Docker的私有云在2014年圣诞期间正式上线,目前已经历数次双十一、双十二的实际检验。Docker的稳定性和容灾能力是其重点关注方向。此外,它还自研了基于Docker的PaaS层编排调度,Jenkins持续集成组件等。

铺垫了这么多,终于可以说说正题了:既然容器技术这么靠谱牛掰,电商巨头纷纷用它来对抗大促的流量洪峰,那么容器技术究竟是如何助力电商大促的?

先来看看大促时面临的具体挑战有哪些:

1. 流量短时间内达到峰值,系统面临宕机危险。电商大促时流量会在短时间内迅速攀升,达到平常的几倍甚至几十倍,一方面对服务器数量和网络带宽资源提出高要求,另一方面,面对瞬间的高并发,机器负载高,系统不稳定性增强,面临宕机危险,将会极大影响用户体验。

2. 计算资源需求突增,技术上如何做到弹性自如,也是一个挑战。电商对于系统的稳定性和性能要求极高,尤其是在大促时如何扛住瞬间急剧增长的流量压力,不会出现服务不可用状态,同时在大促之外的其他时间还能保证资源不被浪费,这对技术的弹性收缩提出挑战。

3. 紧急故障处理能力。电商大促中由于流量的急剧暴涨,如果系统故障、服务不可用,用户在页面浏览、点击、抢购、秒杀、支付等环节都会因此受到影响,如何迅速处理紧急发生的各种问题,考验着电商技术团队的应变能力。

一句话,电商大促对系统的最高要求就是:承担得了100%的业务和流量、稳定性超强、具备容灾能力、可以紧急处理各种故障。

重点来了,基于Docker的容器云在电商大促的系统挑战面前发挥了什么作用呢?

相比于传统虚拟机,容器技术的优势是:

  • 启动快,虚拟机一般在分钟级别,而容器则是秒级,甚至毫秒级;
  • 体量小,虚拟机一般几个G,而容器只需要几百M,甚至几百K,而且可以分层共享;
  • 迁移简单,虚拟机需要提供额外的工具来在不同平台迁移,而容器可以在不同Linux平台之间轻松迁移,镜像的标准化让容器技术更加简单易用;
  • 资源利用率高,一个虚拟机上,可以运行多个容器,相互之间资源共享,提高了资源利用率。

基于此,容器云在电商大促中可以实现以下功能:

— 1 —
高弹性计算

① 自动伸缩,快速扩容,让系统从容应对突发流量。基于Docker的容器云平台,集群中节点和运行中Pod的数量能够动态调整负载,以适应终端用户的需求,非常适合商品秒杀、商品详情页的需求,可大大减轻运维压力,实现自动伸缩;

② 流量自动调度。容器云平台的服务负载可通过算法实时调度到性能最高的容器实例,缓解瞬时流量压力;

③ 节点横向扩展。根据流量变化,当容器实例启动数量快速增长时,系统可自动扩展底层备用资源池;

— 2 —
多平台混合云

① 接入多家主流IaaS平台API,自动组成多云平台,防止某家资源售罄导致的服务有损;

② 支持私有物理机IDC,实现物理机&线上虚拟机组成的协同资源池;

③ 对网络的再封装,实现网络层面的一致性,多平台混合云架构一并支持业务高可用,高性能;

— 3 —
自动化运维

① 自动迁移,容灾容错。容器实例始终保证冗余一定数量,资源池异常可自动迁移至有效资源,提高系统容灾容错能力;

② 解耦与隔离能力。可实现业务与底层计算平台的解耦,容器之间的隔离性也同时保证了业务服务之间的隔离;

③ 不健康节点,自动降级。底层资源池不健康,可自动踢下线,实现节点的有效性保证和资源池的健康度展示;

④ 全方位监控的能力。支持集群级别,应用级别,容器级别的多维度监控,并集成业务维度告警,系统配置好后,可以实现自动化运维。

讲到这,小编要严肃的打个广告了!以下通过一个具体实践案例,来看看时速云企业级容器云PaaS平台是如何为某垂直电商客户解决难题的。

客户痛点:

电商系统和营销系统服务组件众多,每次部署需要耗费很长时间,且容错能力比较薄弱,无法应对大规模并发访问。

时速云解决方案:

 

20161108205929

 

针对电商行业的特点,如应用架构复杂,部署时间长,业务迭代缓慢,采用时速云容器云平台,将电商应用组件容器化,进而将单体应用微服务化,再采用应用编排统一部署,使得整个电商系统的部署运行时间大大缩短,由于容器服务具有优秀的弹性伸缩能力,通过此平台显著提高了系统应对大规模并发的能力。

总结:每年双十一,最热闹的是巨头们不断刷新纪录的交易额,但热闹背后却离不开技术团队默默地支持和付出。在这场年度技术大考中,容器云正成为电商通关的最有效法宝。大促时,它是应对流量洪峰,保证系统稳定的扛把子;大促之余,它是提高生产效率、缩短审批流程、简化开发运维、降低运营成本,提高资源利用率的有效工具。如果你的业务有上述痛点,那就开始考虑搭建一个私有容器云平台吧!

K8S中文社区微信公众号
分享到:更多 ()

评论 抢沙发

评论前必须登录!