案例1 AIX 安全加固惹出大麻烦,生产系统停止服务

某一天用户打电话过来说,业务突然中断了,让我们赶紧过来帮忙处理一下。到了现场用户那里乱成一团,主机,网络,存储,数据库,业务上都在检查各自的问题。经查发现是RAC挂了,DBA通过检查日志发现是脑裂导致的,究其原因网络心跳异常导致的,网络管理员检查网络也没有问题。最后问到近期有没有做过变更,运维管理员说:应集团和上级指示要求风险管理部昨天下发安全风险整改文件,要求我们实施部署了安全加固。昨天晚上在我们的生产环境进行了安全加固。一看里面的内容发现,有一条最为关键,AIX 进行了IP Security 。就是这样这个安全策略才导致RAC心跳通讯中断,发生了脑裂,进而业务不能正常运行。最后赶紧的取消了这个策略,业务正常运行。

参与28

7同行回答

myciciymyciciy联盟成员IT顾问某金融科技公司
周末陆续补充其他案例..........................................显示全部

周末陆续补充其他案例..........................................

收起
银行 · 2016-11-25
浏览2673
  • 可以理解为:防止脑裂,单/双节点重启,一般不会导致2个节点都重启,集群2个节点通过VOTE DISK 进行仲裁,驱逐或则有问题的节点自动下线/重启。如果真的脑裂,那么后果会相当糟糕。
    2016-11-25
zwz99999zwz99999系统工程师dcits
安全加固一般是审计部门或者安全部门要求的,但安全加固不要对系统造成影响,去年在某数据中心,系统管理员在两台ha机器上增加了ipsec ,应付安全检查,后来忘记给去掉,导致ha切换失败,客户把这个问题赖给维保厂商了。后来客户领导才知道这个情况,也没说什么。呵呵!郁闷吧!...显示全部

安全加固一般是审计部门或者安全部门要求的,但安全加固不要对系统造成影响,去年在某数据中心,系统管理员在两台ha机器上增加了ipsec ,应付安全检查,后来忘记给去掉,导致ha切换失败,客户把这个问题赖给维保厂商了。后来客户领导才知道这个情况,也没说什么。呵呵!郁闷吧!

收起
系统集成 · 2016-12-02
浏览2407
qq3508935800qq3508935800系统工程师工程师
RAC是私有网络传输心跳,脑裂现象是其中一个节点关闭,不会2个节点都宕掉。在RAC日志里很清楚就有脑裂记录,这种事情都会乱成一团,只能说是管理混乱。显示全部

RAC是私有网络传输心跳,脑裂现象是其中一个节点关闭,不会2个节点都宕掉。在RAC日志里很清楚就有脑裂记录,这种事情都会乱成一团,只能说是管理混乱。

收起
系统集成 · 2016-12-01
浏览2502
flm20080704flm20080704系统工程师XXXX
安全加固这东西,有些项真的与实际情况需要相冲突,会影响业务的项还是备案一下比较好。即便是过了评审也难免存在疏漏,有条件还是模拟测试一下。显示全部

安全加固这东西,有些项真的与实际情况需要相冲突,会影响业务的项还是备案一下比较好。即便是过了评审也难免存在疏漏,有条件还是模拟测试一下。

收起
IT其它 · 2016-11-26
浏览2408
myciciymyciciy联盟成员IT顾问某金融科技公司
都说月亮惹的祸,我看是加固惹的祸显示全部

都说月亮惹的祸,我看是加固惹的祸

收起
银行 · 2016-12-01
浏览2529
myciciymyciciy联盟成员IT顾问某金融科技公司
安全加固不可怕,可怕的是没有做到结合实际环境与运维,业务,技术管理的评估。显示全部

安全加固不可怕,可怕的是没有做到结合实际环境与运维,业务,技术管理的评估。

收起
银行 · 2016-11-30
浏览2509
永远在学习永远在学习联盟成员系统运维工程师系统管理员
这个太经典了!!客户把这个问题赖给维保厂商了。后来客户领导才知道这个情况,也没说什么显示全部

这个太经典了!!客户把这个问题赖给维保厂商了。后来客户领导才知道这个情况,也没说什么

收起
政府机关 · 2016-12-05
浏览2449

提问者

myciciy
IT顾问某金融科技公司
擅长领域: 服务器存储灾备

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2016-11-25
  • 关注会员:6 人
  • 问题浏览:9173
  • 最近回答:2016-12-05
  • X社区推广