深信服能监控 超融合690向未来更进一步

时间:2023-08-04 15:26:54 来源:今日头条

  原标题:深信服能监控 超融合690向未来更进一步

  随着新一轮AI热潮的到来,越来越多的目光聚焦到了AI上。云计算作为数字化转型的基石之一,其本身需要借助先进技术不断强化自身能力,AI技术的融入,将让用户的数字化转型更加顺畅。

  深信服基于AI First理念将AI能力在自身产品全面推广,通过对智能算法模型进行深度训练构筑技术中台,根据运维、性能、安全方面的能力需求,衍生出了三大技术分支:AIOps、AIRun、AISec。以深信服超融合690版本为例,在AI能力的加持下,超融合不再是单纯承载业务的基础设施,而是助力用户数字化转型的强力支持。

  AIOps:简化运维,提高运维人效比

  变革创新的车轮滚滚向前,IT基础设施的运维手段也在不断进化。从手工运维、流程化标准化运维、平台自动化运维,再到如今的AIOps,每一次模式的创新与变革都意味着能力和效率的提升。

  相比于传统IT基础设施复杂的运维流程,深信服AIOps率先将ITOM与AI技术结合,打造出O2O场景下的AI运维引擎——天工引擎。将AI能力注入超融合690的运维业务,用更高的人效比和更快的响应速度,帮助用户将运维工作化繁为简,实现“人人皆可运维”。如今,超融合690凭借天工引擎可提前7~30天预测故障风险,预测精准度超过90%,1分钟及时发现,3分钟快速定位。

  为了将业务风险消除于萌芽之中,天工引擎采集了log、trace、metric等与故障有强关联性的硬件资源数据,借助深度学习的Attention机制分别建立故障专属预测模型。在模型上通过CNN因果卷积网络、Transformer机制提取并挖掘故障发生的时间规律,实时对照系统内正常工作的软硬件参数,在故障发生前提前预测风险。

  故障预测流程图

  为了避免用户在海量预警下错过关键信息,天工引擎采用NLP算法、分词运算、熵值算法等智能算法,根据模式特征将海量告警信息收敛为关键告警,帮助用户将精力聚焦在关键业务。同时为了帮助用户更快消减故障带来的停机风险,天工引擎可将故障产生的异常数据导入因果推理模型,综合根因定位模拟并生成异常事件的溯源链路,直观的展示异常在指标间的传播效应,帮助运维人员快速、精准的定位问题根因。

  根因分析流程图

  AIRun:性能优化,助跑架构实现高性能

  随着越来越多的业务上云,多业务混合部署已经成为当下云环境常态。多业务部署在同一台主机的方式虽然能在一定程度上节省资源成本,但也加剧了不同业务系统间的资源抢夺。

  为了更好的保障用户核心业务的正常运转,深信服AIRun可基于业务画像分析引擎捕捉虚拟机资源指标与业务性能的关联性信息,并根据性能需求的差异性将平台内运行的业务体系分为计算密集型、访存密集型、IO密集型等类别。

  同时,采用的CPU智能调度算法就像一名拥有“上帝视角”的调度员,在对底层资源全局调控的同时,精准识别核心业务的资源需求,根据业务类别把运算资源优先分配给核心业务,保障业务的流畅运行。在不绑定硬件的前提下,进一步提高资源利用率,实现平台的高性能运转。

  AISec:告警梳理,实现业务上线即安全

  得益于AI中台,超融合的安全能力未来将不止作用于单一的虚拟化。为了更好的应对未知的安全风险,打造安全省心的业务环境,AISec可根据用户云平台过往的告警数据进行时序建模,实时学习并利用业务基线过滤告警,为用户梳理海量的告警信息,优先解决紧急的安全事件。

  AISec安全运营流程图

  同时,对于结果导向不明确的安全线索,AISec可根据图分析和中心性算法评估告警信息的准确性,对安全事件进行深度挖掘并及时定性。在检测层面将安全事件的误报漏报下降一个数量级,做到提前预警、精准预警。而在安全事件的处置层面,运维人员无需具备专业的安全知识,即可对安全事件进行定位、分析、排障,用不断进化的AI能力,实现云平台业务上线即安全。

备注:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投稿:chuanbeiol@163.com
点击展开全文

你遇到过鬼打墙吗,科学家给出了合理的解释!