为保障实时数仓Hologres实例的稳定性,Hologres会在遇到严重缺陷和严重安全性问题时发起计划内运维操作,例如实例版本升级、硬件升级、网络升级等。本文为您介绍如何设置可维护时间窗口等相关操作以及相关事件说明。
注意事项如果开启了小版本自动升级,实时数仓Hologres会在您设置的可维护时间窗口内自动进行实时数仓Hologres小版本升级,在小版本升级过程中可能会出现Query失败的情况,请尽量将可维护时间窗口设置为业务低峰期。
默认可维护时间窗口为21:00~22:00 (Asia/Shanghai UTC+8),您可以根据业务规律,将可维护时间窗口设置在业务低峰期,以免维护过程中可能对业务造成的影响。
只读从实例不支持单独设置可维护时间窗口和小版本自动升级策略,其可维护时间窗口的配置和小版本自动升级策略与主实例一致。
运维事件消息接收设置当Hologres需要发起运维事件时,通常至少在执行前三天通知您,通知方式为短信、语音、邮件、站内信或控制台等。紧急风险修复类事件由于需要尽快修复,通常会在执行前的3天或更短的时间内发送通知并修复。
您需要登录消息中心,在基本接收管理页面确保产品运维通知的通知开关处于开启状态并设置消息接收人(推荐设置为Hologres运维人员),否则您将无法收到相应的通知信息。
修改单个实例的可维护时间窗口访问Hologres实例列表,在顶部菜单栏左侧选择地域,单击目标实例ID。
在实例详情页的基础信息区域,单击可维护时间窗口后的设置。
在设置可维护时间窗口对话框,选择一个合适的可维护时间窗口后单击设置。
开启小版本自动升级策略访问Hologres实例列表,在顶部菜单栏左侧选择地域,单击目标实例ID。
在实例详情页的基础信息区域,单击小版本自动升级后的开关。
在开启小版本自动升级对话框,单击开启。
关闭小版本自动升级策略访问Hologres实例列表,在顶部菜单栏左侧选择地域,单击目标实例ID。
在实例详情页的基础信息区域,单击小版本自动升级后的开关。
在关闭小版本自动升级对话框,单击关闭。
事件说明后端系统可能会在可维护时间窗口中执行的操作和影响如下:
事件原因
影响类型
影响说明
实例重启
实例短时中断
操作过程中,将产生下述影响:
实例通常会有5~10分钟以内的连接断开。对于表文件较多、表较多的实例标准升级过程中的闪断时间通常会超过10分钟。请在业务低峰期执行,并确保应用程序具备重连机制。
如遇到需要标准升级的情况,请关注版本间的差异,并根据业务情况选择合适的升级时间。
热升级
实例闪断
操作过程中,将产生下述影响:
实例将发生连接闪断及10分钟以内的只读状态(用于等待数据完全同步),请将可维护时间窗口设置在业务低峰期,并确保应用程序具备重连机制。
短暂影响该实例在DataWorks和Flink中的使用,操作完成后自动恢复正常。
小版本间的差异
不同的小版本间更新的内容有所区别,您需要关注升级后的小版本和当前小版本的差异。
标准升级
实例短时中断
操作过程中,将产生下述影响:
实例通常会有5~10分钟以内的连接断开。对于表文件较多、表较多的实例标准升级过程中的闪断时间通常会超过10分钟。请在业务低峰期执行,并确保应用程序具备重连机制。
如遇到需要标准升级的情况,请关注版本间的差异,并根据业务情况选择合适的升级时间。