尊龙时凯

    热门搜索 Zabbix技术资料 Zabbix常见问、答讨论 成功案例 Zabbix交流区 Prometheus交流区

    案例解读 | 某省农村信用社基础环境监控项目实践

    PART01 项目背景
    01客户介绍

    案例客户为某省农村信用社。

    02痛点分析

    随着金融科技的飞速发展,该信用社的信息化建设持续推进,基础环境日益复杂。现有监控系统在应对国产化设备监控需求时,逐渐暴露出局限性。为适应复杂的信息化架构,满足不断增长的业务需求,信用社计划对监控系统进行升级改造。项目建设目标如下:

    1. 国产化替代:解决对国产化设备监控的兼容性问题,全面替换IBM Tivoli监控系统;

    2. 统一视图:整合多个数据中心及灾备中心的服务器、存储、虚拟化平台等硬件资产,构建全栈统一的软硬件监控视图;

    3. 性能优化:针对新增监控对象与指标,优化SIMO-V4.0系统的集群部署及高可用性,确保系统稳定运行。

    4. 监控对象类型:

    • 物理设备:包括IBM、华为、曙光等品牌的服务器,以及EMC、华为、天合翔宇等品牌的存储设备;
    • 虚拟化平台:涵盖VMware、云宏、华为云等;
    • 专用设备:如密码机、安全网关等。

    PART02 尊龙时凯方案
    01技术架构

    项目采用先进的监控技术架构,通过Agent、IPMI、SNMP、SNMP Trap、Syslog、JDBC、JMX等多种协议,对基础软硬件进行全面的性能指标采集与监控告警。该架构不仅覆盖了原IBM Tivoli系统的监控范围,还弥补了其对国产化设备监控的不足,成功实现国产化替代。

    • 多数据中心协同:项目涉及多个数据中心,每个数据中心均部署多个代理服务器,通过防火墙与采集服务相连。代理服务器分担流量,提供负载均衡,保障系统稳定。
    • 高可用性保障:采集服务采用主备HA机制,主节点与备节点通过心跳检测实时监控状态,确保数据采集连续可靠。数据库服务采用双机主备架构,VIP运行在主节点,主节点故障时,VIP自动切换到备节点,保障数据存储高可用。门户网站采用双机HA配置,确保用户访问连续、系统稳定。
    • 开放性与集成性:平台提供标准对外集成接口,能与CMDB平台、移动办公平台、告警平台以及智能运维平台等外部系统无缝对接,通过接口或数据源与主系统交互,实现业务支持与运维功能全面整合。

    02监控对象与核心指标

    • 主机监控:涵盖RedHat、Centos、Windows、AIX、麒麟、统信、欧拉等多种操作系统,重点关注AIX小机LPAR信息、计算内存、JFS文件系统、errpt日志信息、LVM信息以及IOPS等关键指标。
    • 网络设备监控:针对F5、弘积、迪普SLB等网络设备,监控虚拟服务状态、NTP、吞吐量以及监控状态等重要指标。
    • 虚拟化监控:对VCentor、云宏虚拟化、华为云cloudstack等虚拟化平台进行深度监控,覆盖Clusters、Datacenters、Datastores、Hypervisors、VM等资源,实现vCenter平台告警对接,呈现资源关联状态与拓扑。
    • 服务器监控:涉及IBM、华为、曙光、浪潮、HMC等品牌服务器,通过IPMI、SNMP等协议查询数据,重点关注告警对接、硬盘状态、电源状态等指标。
    • 存储监控:针对EMC VNX、EMC VMAX、IBM、HDS、天合翔宇、华为云对象存储等存储设备,采用专门存储工具、SMI-S、SNMP、API等方式查询数据,重点关注告警对接、硬盘状态、IOPS等指标。
    • 专用设备监控:涵盖中盾安信、信安世纪、江南天安、金电网安等专用设备,通过私有协议、SNMP、API等连接查询数据,重点关注服务状态等指标。

    03自动巡检与数据对接

    • 自动巡检:项目具备自定义关联配置、底层数据集成整合、自定义异常规则以及界面统一管理展示的能力,对服务器、存储、专用设备、负载均衡、操作系统、数据库、中间件、应用服务进程等日常巡检项进行统一管理。系统提供横向、纵向巡检视图,醒目提示并方便查询巡检异常,大幅提升巡检效率。
    • 数据对接:项目实现与第三方CMDB数据的无缝对接,以业务系统为管理维度,通过数据接口从第三方CMDB自动生成业务系统信息,包括相关资源及关联关系,并以拓扑图直观呈现。同时,与某移动办公平台对接,自定义监控指标视图可在该平台展示,方便业务系统负责人及时查看业务系统基础监控状况。

    PART03 客户收益

    1. 解决国产化设备兼容性问题

    项目成功解决国产化设备监控的兼容性问题,实现对IBM Tivoli监控系统的全面国产化替代,为客户信息化建设提供更稳定、可靠的监控支持。

    2. 风险预警与业务保障

    新的运维监控系统能及时发现潜在的不可用风险,通过预警功能通知运维人员处理;以业务为核心的统一运维监控实现对关键业务流的动态监测,确保业务运行的可用性与稳定性。

    3. 运维效率显著提升

    项目基于全栈监控实现对所有IT资源的统一监控纳管,结合集中告警功能,确保运维管理无死角。运维人员能及时发现故障异常并快速响应,运维效率大幅提高。此外,自动巡检功能将运维人员从繁琐的手动巡检工作中解放出来,使其能投入更多时间和精力到更有价值的业务工作中,进一步提升运维效率。

    4. 管理成本降低

    平台的使用显著改善了业务系统的资源利用率、可靠性、稳定性、性能,以及管理的简易性和快捷性。通过优化配置与管理流程,项目在软硬件基础设施和人力资源方面节省了大量投入,有效降低管理成本。

    尊龙时凯社区已开发尊龙时凯监控免费版和尊龙时凯MCM(监控+CMDB)免费版,欢迎下载使用!

    The prev: The next:

    Related recommendations

    Expand more!

    快速导航

    成功案例

    View all