2020乌镇用户大会| 擎创夏洛克AIOps智慧运营平台全新发布,点亮数字化转型之路

9月4-6日,由中国电子标准化研究院软件工程与评估中心主办,ITSS数据中心运营管理工作组(DCMG)和双态IT联盟(BOA)承办的2020第四届双态IT乌镇用户大会正式召开。作为大会的重要组成部分,擎创科技『智能运维—数字化转型必备利器 』研讨会暨新品发布会也成功举行。
在这里插入图片描述

伴随着移动互联网、大数据和云计算等技术的逐步成熟以及对IT架构的重构,越来越多的金融机构启动核心系统的分布式架构改造。尤其是随着数字化转型不断深入,IT运维理念经历了巨大变化,开始由传统的ITOM和ITOA演变为新一代的AIOps(智能运维)。

当前传统的运维面临着架构日益复杂化、业务需求多样化和运维数据海量化等挑战,全新的IT运维管理需求更是难以满足。在此背景下,如何通过人工智能技术赋能运维管理,如何运用AIOps实现精准告警、异常检测、根因定位和容量分析等场景,已经成为企业数字化转型的根本需求。

为了能够更深入地探讨数字化转型下的智能运维建设之路,擎创特地举办了本次智能运维研讨会,擎创CEO杨辰、宁波银行运维高级经理王吉云、复旦大学计算机科学技术学院王鹏教授、擎创CTO葛晓波分别从智能运维建设路径、落地案例实践、算法场景探索、运维产品能力四个方面展开了讨论和分享,并全新发布了夏洛克AIOps智慧运营平台。

01 智能运维建设路径:三大原则六步走路线

在这里插入图片描述

在传统运维方式下,数据规模大且离散,数据治理和全面分析能力薄弱且依赖于经验和规则,运维十分被动,解决问题效率非常低下,运维的实用性大打折扣,难以满足当前主动运营的要求。因此必须借助一定的手段和方式,如对客户的IT运维数据实现全量的集中化管理,实现数据实时处理、智能分析和预测,进行高效根因定位。

在《从传统运维走向智慧运营建设之道》的演讲中,擎创CEO杨辰指出:“这些都是智能运维AIOps所具备的。智能运维是一种全新的数字化运维能力,也将是数字化转型的必备能力。智能运维相对于传统运维模式而言,能够在运维数据治理、业务数字化风险、运维人力成本和业务侧影响力四个方面有本质的效能提升。

根据擎创数十家企业智能运维落地建设的经验,智能运维建设一般遵循从自身运维基础出发、夯实运维数据处理能力和循序渐进场景化建设三大原则和六步走路线:集中监控智能化改造、指标监控智能化改造、日志智能异常检测弥补监控手段不足、智能故障综合排查—根因分析和定位、智能知识管理—知识图谱和故障自愈。

**智能运维的本质其实是提升运维数据的认知能力。**它能够帮助用户基于业务导向看待问题,更迅捷地发现异常、更有效地诊断问题根因、更业务导向地进行运营分析和决策、更持续有力地提升运维数据质量。”

02 宁波银行运维实践:让传统监控有智能大脑

在这里插入图片描述

宁波银行作为国内首家在深圳证券交易所挂牌上市的城市商业银行,成立20多年以来在各项业务中都取得了长足的发展,在数字化转型中走在了前列,近期更是引入擎创智能运维解决方案帮助其更好地转型和发展。

宁波银行运维管理部高级经理王吉云分享了《宁波银行智能运维探索与实践》。在日益复杂的系统架构以及海量的IT运维数据的背景下,数据中心运维管理难度和重要性日渐凸显,且面临着以下痛点:新业务增长快,系统容量怎么评估?系统发生问题,怎么减少客户的不佳体验?如何加快故障处理,减少业务影响?

宁波银行原有的监控体系已经具备了较为全面的指标采集能力,能够解决运维中遇到的大部分问题,只是在分析能力上还有所欠缺。因此宁波银行选择了将智能运维能力融合到既有的监控系统中,通过实时流处理引擎实现数据的实时对接和分析,通过CMDB实现应用运维和基础架构运维的结合,以此辅助根因定位。

基于擎创的智能运维解决方案,宁波银行成功落地了诸多运维场景,如指标异常检测动态基线和容量预测,实现指标异常全业务系统覆盖检测和以天/月为单位的容量预测;通过健康度卡片直观展示业务、主机和数据库的运行情况;实现实时流式处理和交易异常根因定位等。

03 智能算法场景探索:分析聚类和知识图谱

在这里插入图片描述

本次研讨会还邀请了复旦大学计算机科学技术学院博士生导师、青年科学家、智能运维算法专家王鹏教授,为在场嘉宾带来了《智能运维分析领域中的算法研究和场景探索》的演讲。

“智能运维,通俗的讲是对规则的AI化,即将人工总结运维规则的过程变为自动学习的过程。智能算法代替手工规则势必成为未来发展趋势,原因在于日益复杂的系统使得专家难以制定合理有效的规则,且快速迭代变化的软件使得规则需要不断调整。

智能运维的研究主要在于算法的设计能力、运维场景的理解能力和平台的工程化能力,当前还面临着业务复杂多样、数据海量异构等挑战。算法已经在多个领域起到了重要作用,但仍有大量问题需要解决,尤其是算法易用性的提升、算法语义的提升和异构数据融合能力的提升。”

04 智能运维新动力:擎创AIOps新品能力

在这里插入图片描述

经过多个版本的优化迭代,夏洛克AIOps已经具备了全新的多样化功能,擎创CTO葛晓波就最新发布的产品能力进行了阐述和分享。

擎创智能运维产品——夏洛克AIOps智慧运营平台,能够整合既有的多样化监控工具,监控告警事件、性能指标、日志和容量等多维数据,立体化覆盖到智能运维管理的全生命周期,包括告警辨析中心、指标解析中心、日志精析中心、日智速析专家、运营决策中心和运维数字中台等。

最新发布的夏洛克数字运维中台,是智能运维各应用场景的支撑平台,提供三类服务,包括数据治理服务、数据流式处理服务及AI平台服务,通过海量数据处理分析能力和强大的算法支撑能力协助企业灵活构建多样化智能运维场景,并持续提升运维数据质量和治理水平。全新发布的夏洛克指标解析中心和运营决策中心,也具备更加强大的功能,例如CMDB集成、指标健康体系自定义、数据整合分析能力更加全面等。
在这里插入图片描述

研讨会最后,在全场嘉宾和客户的见证下,擎创正式全新发布了夏洛克AIOps智慧运营平台。未来运维势必是由运维走向运营,智能运维也将有助于运维迈向更加智能化的阶段,走向业务运营的数字化转型之路。

目前,擎创已经在AIOps领域实践探索多年,并在银行、证券、保险、交通和能源等多个行业落地了智能运维场景,积累了大量的行业头部客户。随着智能运维市场规模的扩大,擎创也将继续提升运维数据的认知能力,以“三个原则六步走”为基础,打造智能运维产品中最实用的工具,构建实用工具中最智能的产品,服务于更多的企业级客户,助力其走上运维智能化道路。