EVO-AIOps亦维自动化管理系统
概 述
随着数字化时代和工业4.0的到来,各行各业都在积极探索自动化智能化,运维行业也不例外,随着数据中心IT基础架构规模和业务系统复杂度的快速增长,传统人工运维的效率和风险已远不能满足业务发展的需求,基于标准化、流程化、自动化和智能化构建监管控一体化的运维管理体系已是行业共识、大势所趋。
目前国内数据中心运维经过十多年的发展,基本遵循标准化、流程化、自动化和智能化的建设路线,截止目前大多数行业客户数据中心运维管理已经具备较高的标准化和流程化程度,为进一步实现自动化和智能化提供了良好的基础,如日常巡检、软件安装配置、日常运维等,可以实现端到端的自动化;对于难以完全标准化的工作,进行切分,将有标准化基础的操作步骤封装打包,以提高管理级别和粒度,增强复用性的同时,顾及实用性,例如应用发布环节的介质分发、应用起停、环境校验、状态检查等。目前工商银行宣布其数据中心运维自动化比例已高达90%,为其它行业客户起到良好的示范作用。
中亦科技EVO自动化运维管理平台基于多年总行级数据中心运维最佳实践的基础上,致力于提供IT基础架构全生命周期的自动化运维解决方案,帮助客户实现从物理服务器、磁盘阵列、虚拟服务器、操作系统数据库中间件、网络到应用、甚至客户端,提供设备纳管、批量管理、作业管理、软件部署、配置检查、批量变更、配置比对、补丁管理、应用发布、操作审计、合规检查、健康检查、裸机安装、云管平台等多种功能,将日常运维工作进行标准化和自动化封装,让工程师从重复性的运维工作中释放出来,同时遵循最佳实践和法律法规的要求,大幅提升运维管理的效率和水平。
产品理念

产品架构

产品展示

云服务管理平台
-
支持IBM PowerVM、HP VSE、VMware、KVM的等主流虚拟化平台;
-
支持VIO的自动化安装、配置和管理,实现IBM Power裸机安装;
-
支持EMC、HDS、NetApp等主流存储的集中管理;
-
提供基于服务目录的云服务套餐定制;
-
具备基础环境的一键交付能力;
-
提供全生命周期的资源管理,包括资源申请、审批、调整、回收等;
-
实时监控资源池,提供资源规划及使用报表;
-
一键式系统在线迁移;
-
多层次实时监控平台内资源的使用情况,为运维人员提供资源分配、调度、回收决策依据,提供弹性业务服务能力;

资源详情
服务器自动化
●批量管理
-
高效的批量管理平台,支持批量分发、执行和集中管理;
-
批量作业结果异步返回,实时监控作业运行状况;
-
支持及时运行、定时运行和周期运行三种模式;
-
支持作业结果个性化处理,通过设定解析规则实现作业结果动态解析;

作业执行
●服务封装
-
提供灵活的脚本服务化封装功能,用户可自助式封装日常运维中的各种基础服务;
-
内置大量开箱即用的平台服务,支持从对象发起服务和从软件发起服务两大功能群;
-
降低技术门槛、无需登录系统、安全可靠;
-
灵活组合平台服务套餐从而适应和满足不同企业运维管理流程;
-
遵循最小化授权原则,可按需设计服务产品的消费流程,确保所有操作安全可控;

服务封装
●调度引擎
遵循BPMN2.0标准,可视化的定制界面,通过托拉拽方便实现各种运维流程的定义和配置,支持串行、并行、分支、人工干预以及节点跳转,整个执行过程支持可视化动态展示;适用于跨系统多角色复杂的运维场景,例如一键式开关机、一键式日志收集、一键式应用发布、一键式变更操作、一键式部署等;应用发布支持发布流程审批、发布模板管理、环境检查、版本管理、批量分发和日志管理等功能;
-
遵循国际标准(BPMN2.0);
-
提供可视化编排设计器,通过拖拽式实现运维流程的编排与管理;
-
支持串行、并行、分支、跳转和人工干预等模式;
-
执行过程动态展示;
-
支持子流程、人机混编、跨系统、参数设定、导入导出等丰富特性;
-
支持定时触发、手工触发及API调用等流程编排调度方式;

流程编辑
●规则引擎
内置功能强大规则引擎,基于RETE算法实现,支持DSL、Java语言进行规则编写,实现用自然语言方式来描述业务规则,使得业务人员也可以看懂专业的规则代码。实现业务逻辑和业务规则的分离,实现业务规则的集中管理。
-
基于RETE算法,支持DSL、Java语言进行规则编写;
-
自定义告警规则,支持正则表达式;
-
自定义解析规则,自动化生成检查报告;
-
自定义检查项和检查模板,支持导入导出;
-
业务逻辑和业务规则的分离;

规则编写

添加规则
网络自动化
-
通过自定义驱动支持不同厂家各种类型的网络设备;
-
支持批量自动化功能,可高效完成针对网络设备的配置变更、信息收集等操作;
-
具备配置备份、比对和恢复能力;
-
内置网络设备健康巡检、合规检查和密码管理等常用功能;
-
支持网络设备的分组管理;

网络设备
配置管理
-
配置信息收集管理支持手动和自动方式;
-
支持及时收集和定时收集两种模式,确保配置信息的及时性和准确性;
-
具备生命周期管理能力,支持自定义CI配置项,全面的元数据管理能力;
-
监控级的配置动态信息管理和展现功能,支持告警丰富;

应用发布管理
-
利用全栈自动化能力,协同开发、运营及业务部门,从根本上转变基础环境交付方式、应用交付方式以及运维服务生产和消费方式,进一步提升数据中心的整体运营效率;
-
支持作业步骤自助式封装,提供传输、对比、校验等丰富的通用组件;
-
内建介质及作业流程版本管理系统,并可与现有GIT、SVN系统对接;
-
借助DevOps理念有机整合开发及运维,交付过程变得流畅无碍;
-
编译、开发、测试、部署上线全面加速,整体交付周期全面缩短;
-
各角色可以基于统一的交付流程紧密协作,整个过程动态可视;
-
借鉴精益和敏捷思想,通过在整个流水线上持续实现自动化,进一步改进流水线的一致性、质量、效率;

特色功能和最佳实践
●脚本管理
-
脚本统一集中管理,确保脚本的一致性和安全性;
-
数据库加密存放,只有授权方可使用;
-
脚本管理版本管理,提升脚本规范性;
-
敏感字过滤,方便脚本审核和安全管控;
-
脚本配置比对,方便易用;

脚本对比

敏感字过滤
●裸机安装
-
实现X86服务器裸机自动化安装与管理;
-
设备MAC地址自动扫描、设备批量导入、配置信息收集管理;
-
支持远程RAID配置、密码管理、IP动态分配;
-
提供镜像管理、模板管理和远程开关机等功能;
-
支持RedHat、Suse、CentOS、Windows、ESX等主流操作系统和虚拟化平台;
-
支持设备硬件IPMI监控告警;

裸机管理
●软件部署
-
支持业内主流商业软件,如WAS、Weblogic、Oracle RAC、MQ、HACMP、DB2、GPFS、CICS等软件的自动化安装、配置和卸载;
-
内置安装配置最佳实践;
-
可扩展支持的软件类型和版本,自动生成图形向导界面;
-
支持模板功能,支持自定义参数,可批量创建符合企业自定义标准的基础环境;
-
支持集群配置,能够根据自定义的拓扑结构一键式完成WAS、Oracle RAC、MQ等软件的集群配置;

软件安装
●单点登录
-
统一入囗,强化生产系统访问控制;
-
提供WebConsole功能,便于操作使用;
-
操作录屏回放,关键字过滤,满足审计要求;
-
支持权限控制和报表导出等功能;

单点登录
●健康检查
-
支持Linux、AlX、HP-UX、Windows、WAS、Weblogic、Oracle等主流操作Web化集中结果展示,同时支持PDF、HTML、Word等格式导出报告;
-
支持即时巡检和计划巡检两种模式;
-
巡检报告自动发送邮件;
-
提供汇总巡检报告,提升巡检工作效率;
-
各次巡检结果集中管理,具备一定程度的关联分析能力;

健康检查
●Oracle故障诊断
-
自动分析可能出现内存泄漏的程序;
-
支持业务系统数据库出现阻塞时的快速分析;
-
自动梳理行锁、表锁的层次关系、递归关系;
-
自动梳理发生异常等待的进程之间的层次关系、递归关系;
-
支持历史故障回放、历史信息查询、追溯;
-
自动分析执行计划中效率最差的瓶颈步骤;
-
自动分析表级别、数据库级别的碎片情况;
-
自动分析回滚表空间使用情况;
-
自动分析临时表空间使用情况;

Oracle 故障诊断
●Oracle SQL审核
-
具备模式分析和SQL分析功能;
-
内置丰富的SQL审核标准,审核规则支持动态扩展;
-
支持上线前审核和在线审核;
-
评审报告提供问题定位和改进建议;

Oracle SQL 审核