弹性伸缩 AS(Auto Scaling)可以根据您的业务需求和策略,自动调整云服务器计算资源,确保您拥有适量的云服务器来处理您的应用程序负载。对于您的 Web 服务而言,智能的扩展和收缩是成本控制和资源管理的重要组成部分。Web 应用程序开始获得更多请求流量时,您将添加更多的服务器来应对额外负载。同时,当 Web 应用程序的流量开始减少时,您将终止未充分利用的服务器。
如果使用 AS 进行容量调整,您只需事先设置好扩容条件及缩容条件。AS 会在达到条件时自动增加使用的服务器数量以维护性能;在需求下降时,AS 会根据您的缩容条件减少服务器数量,最大限度地帮助您降低成本。
如下图对比所示,通过使用弹性伸缩 AS,您的集群可以永远保留恰到好处的资源量,并处于健康状态。您将告别传统模式下的多种烦恼:
在常见的 Web 应用服务中,您的集群通常运行应用程序的多个副本来满足客户流量。例如接入层的前端服务器集群、逻辑层的应用服务器集群、后端的缓存服务器集群。每个实例都可以处理客户请求。
这些类似或相同的实例,数量通常是可调节的。您可以将这些相同或类似的机器归到一个伸缩组中管理起来:
弹性伸缩产品有以下基本概念:
伸缩组是遵循相同规则、面向同一场景的云服务器实例的集合。伸缩组定义了组内云服务器数的最大值、最小值及其相关联的负载均衡实例等属性。
启动配置是自动创建云服务器的模版,其中包括镜像ID、云服务器实例类型、系统盘及数据盘类型和容量、密钥对、安全组等。
创建伸缩组时必须指定启动配置,启动配置一经创建后其属性将不能编辑。
即执行伸缩动作的条件。触发条件可以是时间或云监控的报警,动作可以是移出或加入云服务器。
伸缩策略有以下两种:定时伸缩策略
到达某个固定时间点,自动增加或减少云服务器,支持周期性重复。
告警伸缩
基于云监控指标(如CPU、内存、网络流量),自动增加或减少云服务器。
冷却时间是指在同一个伸缩组内,一个伸缩活动(添加或移出云服务器)执行完成后的一段锁定时间。在这段时间内,该伸缩组不执行伸缩活动。冷却时间可指定范围为 0 - 999999(秒)。