>

应该从以下几个角度考虑如何选择和建设运维管

- 编辑:澳门博发娱乐官网 -

应该从以下几个角度考虑如何选择和建设运维管

企业在选择运维和管理工具时,首先要考虑当前企业的IT系统处于何种水平,在IT系统建设初期,设备数量少,问题也少,这时简单的用几个人就可以解决。随着IT系统的增多,各种关联的系统,复杂度成几何量级增长时,就需要陆续引入管理系统以保障IT系统能够正常的提供业务。应该从以下几个角度考虑如何选择和建设运维管理系统:

哪种监控工具才是运维人的最爱?

作为世界上华丽的舞蹈--华尔兹享有"舞中之后"的美称。华尔兹速度虽慢,但技艺难度却很大,不仅要先练好基本步,更要在此基础上学习各种变化步、花样步以及组合和套路。

IT运维自动化是指将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。

前言:IT监控运维系统,起源于各设备厂家的网元网管等监控工具,伴随着信息化的发展而升级换代,经历了大数据、虚拟化、云计算等技术革命的考验逐渐完善成熟。IT监控运维系统从最开始的解决故障,到提供高效的运维服务,已逐渐成为IT运维部门日常运维工作中必不可少的工具。

首先应该考虑集中的监控功能,快速发现问题,并且进行跟踪处理,保障每个故障都获得根本解决,以减轻IT系统故障对企业业务的影响;

 

BSMBusiness Service Management,即业务服务管理)的理念是从企业业务角度出发,来重新认识IT对业务的整合,是IT创新管理的风向标。BSM可以称为IT运维管理领域中的"华尔兹",与华尔兹一样,因为它同样也具有了看似质朴简单却又高贵深奥的特质,所以广受一线IT运维人士的认同。它是打造一流的运维管理体制,是实现从优秀到卓越的关键,但BSM不是一蹴而就的。因此,企业在落实BSM前要形成一定的基础条件,也就是要先掌握最基本的舞步,然后才能倾听业务部门的节拍,将BSM充满活力地舞动。

传统运维管理方式存在的问题

随着企事业单位IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,为实现信息资源合理配置、有效管理,确保系统安全可靠运行,IT集中监控系统的建设成为企业信息化运维工作的重点之一。同时,运维活动也缺少管控,如没有构建服务台、知识库、CMDB、事件管理等基本流程。此外,监控运维并不是简单的“监控+流程”,两者的有效结合也是一个难点。

其次应该是快速的诊断和排障功能,在发现问题的基础上,快速找到问题根源,并且及时将问题解决;

那些指标需要监控?我能监控到什么?能监控到何种程度?或许这些问题连你自己都难说清楚。先看看运维兄弟们的现状。

笨拙的舞步会踩踏业务主管的脚面

目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的IT运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面:

传统运维面临的问题

然后就应该IT考虑长期的优化和建设的规划,持续降低IT系统的故障率,提高IT系统的使用率。

 

作为国内领先的IT运维管理专家,北塔软件在协助电力、政府、金融、电信等4000家用户进行IT运维管理最佳实践中发现,绝大多数的企业深知BSM可以帮助他们改变在公司中的地位,但由于IT基础设施没有实现牢固的监控架构,IT部门的舌尖上也就无法品尝到BSM的美味了。因为主动运维的模式未能落实,假若销售业绩出现问题时,业务部门还会以系统故障,或是网络缓慢为由"起诉"IT经理。但若反过来想,这些投诉是有理由的,又有谁在一场舞会上被舞伴踩了N次脚面之后,不会埋怨几句呢?

(1)运维人员被动、效率低

错综复杂的IT元素难以有效监控

网络运维管理见仁见智,各家关注点各有不同。但是必须注重以下三点:

1.运维现状

尽管IT运维管理技术在不断进步,但实际上,很多IT运维工程师并没有真正解脱出来,我们可以将传统的IT运维管理简单概括成四个字叫:"人拉肩扛"。因此,在BSM实施之前,企业要做的第一件大事就是解决设备层面的监控和预警难题。因为当涉及到今后的业务管理时,底层监控数据的分析结果,是对业务系统的运行状况最有说服力的。要改善这一状况,国内IT运维管理专家"北塔软件"举例说:IT部门需要把网络、路由器、交换机、服务器等纳入到北塔BTIMBetasoft Integrated Management,IT综合管理软件)平台上进行管理,保证其运行不出问题。通过IT基础设施管理服务的建设,IT部门有能力提供7X24小时全天候对服务器、网络和数据库进行监控。IT运维工程师会习惯使用监控工具,而不是手工打理,他们每天都会遵照和运用基础设施运维管理工具发现问题、解决问题、优化系统,并依靠ITIL方法论逐步对应出合理化的流程。

在IT运维过程中,只有当事件已经发生并已造成业务影响时才能发现和着手处理,这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量很难提高,导致IT部门和业务部门对IT运维的服务满意度都不高。目前绝大多数的企业IT运维人员日常大部分时间和精力是处理一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,,使到IT运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现恶性连锁反应。

从宏观上看,IT设施种类各异,组成复杂,从最基础机房动力环境->基础网络->存储->X86(小型机平台)->系统->应用;从硬件到软件;从后台应用支撑服务到前台页面服务,这些错综复杂的IT元素很难有效整合监控。

快:发现设备速度快,打开速度快,故障定位速度快。

传统企业的计算机运维是在用户使用计算机过程中发现故障之后,通知运维人员,再由运维人员采取相应的补救措施。运维人员日常大部分时间和精力都花在处理简单且重复的问题上,而且由于故障预警机制不完善,往往是故障发生后才会进行处理,这种情况使运维人员的工作经常处于被动“救火”状态,这种被动的运维模式让IT部门疲惫不堪。运维质量如何提高?生产部门能对运维部有满意的评价吗?

业务视图为IT与业务融合搭好舞台

(2)缺乏一套高效的IT运维机制

从微观上细究,特定IT设施种类各异,品牌繁多。以存储为例,品牌涉及IBM、HP、EMC、Netapp 日立、华为、浪潮等,监控对象指标包含磁盘阵列的各个组件,指标包括风扇、电源、电池、控制器、硬盘的状态、实时性能,以及交换机的各温度、电池、主机映射关系等,获取这些指标并非易事。

准:在客户的复杂网络环境中拓扑发现准确,告警上报准确。

目前我们在运维管理过程中缺少明确的角色定义和责任划分,以及自动化的集成运维管理平台,以至于问题出现后很难快速、准确地找到原因,而且在处理故障之后也缺乏必要的跟踪与记录。

没有舞伴而空有一身舞技,就像藏在黑暗里的宝石般令人遣憾。BSM就好比双人舞,舞伴之间的默契配合就非常重要。某企业的一名IT部门主管曾经冥想:"业务部门的人70%懂自己的业务,30%懂IT,这样他们就清楚先进的IT技术如何帮助业务提高效率、创造价值、或改进业务流程;IT部门的人70%懂IT,30%懂业务,这样他们就明白业务部门的困境、苦恼、竞争压力,从而提出好的解决方案,这样就可以进入一个良性循环。"不过这是一种非常理想的状态,通常这也只能算是乌托邦而已。那么,IT运维管理就真的无法实现与业务部门的融合了吗?

目前许多企业在IT运维管理过程中缺少自动化的运维管理模式,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行修复和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化的解决方案,也缺乏全面的跟踪记录。

传统运维工具单一,无法集中管控

稳:系统长时间稳定运行。

2.隐藏在流量背后的秘密

针对这个问题,北塔软件副总经理孙永杰先生认为:"按照一般公司的部门分工,业务部门主要负责业务软件部分的故障,当出现非软件问题时,均有IT部门进行排查,而传统上IT部门会根据网络、服务器、基础软件各个传统分类进行问题的排查,越是分工明确的公司,每个独立的设备都会有专人维护,那么在这个故障排查的过程所花的时间就会越长。而引入BSM后,IT部门以业务为视角,将业务所关联的网络、服务器、基础软件的端口等一目了然的规划在一张图形上,快速定位故障点,这样就能实现及时处理投诉,提高业务部门的满意度。"

(3)缺乏高效的IT运维技术工具

企事业单位用户可以通过厂家提供的管理工具,如vmware 的VC客户端,存储的管理客户端,硬件服务器的web管理控制台,或者通过查看日志/硬件设备的指示灯等方式查看运行状态和性能指标。显然,这些零散的方式会增加运维工作量,影响故障发现的及时性,IT运维人员迫切需要一个统一集中的平台将以上监控任务有效整合。同时,由于缺少有效的流程管控机制,运维工作总是处于“救火式”状态。事前无准备,事中无跟踪,事后无法追溯,运维经验无法沉淀积累与复用。

如果管理软件不能达到以上基本要求,它的其他管理就缺乏坚实的根基,难以实际应用。

网络接口的通端,流量的大小,已满足不了目前运维故障排除的需要。我们需要将流量分析的更深入,更细致。

此前,由于企业已经可以从IT基础设施综合管理平台,以一致的方式来展示每个子系统的事件信息,并能够与配置管理平台CMDB)紧密融合。所以,现在可以围绕企业的关键业务,借助动态的业务与系统之间的映射视图来引入服务水平协议SLA)机制。在此阶段,可以利用BTIM中的构建业务视图,非常清晰地看到业务架构、业务运行、业务使用、事件原因分析、业务统计与分析。这种整合后结果,可以顾及业务系统全面的工作状态、运行效果以及与之直接或间接相关的各个方面,如:业务系统整体机构的吞吐量、机房环境影响等等。

随着信息化建设的深入,企业IT系统日趋复杂,林林总总的网络设备、服务器、中间件、业务系统等让IT运维人员难以从容应对,即使加班加点地维护、部署、管理也经常会因设备出现故障而导致业务的中断,严重影响企业的正常运转。出现这些问题部分原因是企业缺乏事件监控和诊断工具等IT运维技术工具,因为在没有高效的技术工具的支持下故障事件很难得到主动、快速处理。

运维过程无流程或流程不成体系

在选择运维管理工具时,除了要看运维管理工具是否可以对企业内使用的IT资源进行全面的监控管理,同时还要关注是否基于业务视角的管理,IT服务于业务,避免管理层面与业务相脱离。另外由于大中型企业的IT规模较大,甚至有可能是跨地域范围的,所以在选型时,也要关注一下运维管理工具的架构和性能是否可以监控大规模网络节点,能否满足企业中分级、分权限管理的需求等等。

图片 1

舞者最高的境界是懂得音乐所描述的内涵,而我们的IT运维管理,最重要的就是要听得懂业务部门的心声。BSM让业务部门和IT部门能够拥有统一的管理语言、管理视角。结合企业战略和目前业务运营情况,辨识企业业务服务需求,特别是关键业务应用。扎实的舞步基础,再加上与舞伴的心灵沟通,我们最终会实现实施BSM的预期目标。  

IT运维自动化迫在眉睫

随着信息化及互联网+普及推广,企事业单位已经从大规模的信息化建设向信息化运维转变,运维团队不断扩大,信息化管理流程日益复杂,之前的纸制化审批流程效率低,难以适应新环境下的流程管理,需建立统一、规范、层次化的服务管理流程和服务管理体系。面对复杂的IT环境,缺乏规范化、自动化的运维处理流程,缺乏完善的故障处理和快速修复机制。

还是要根据自身的实际情况来选择,一般来说,运维工具可以分为运维监控工具、运维流程管理工具、厂商专业工具等几类。

图1 传统流量监控工具看表象

...

尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,原因在于目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法判断问题的根源在哪里。另外,目前许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。

看OneCneter如何破局?

当企业的IT运维工程师不是很多时(6-7人以下),可以无需引入运维流程管理工具,而用OA、邮件等辅助工具可以达到类似的效果。目前市面上没有很好的开源的运维流程管理工具,当必须要引入运维流程管理工具时,使用国产化的商业工具几乎是必然的选择。

很多漏洞利用攻击、ShellCode攻击都混杂着正常流量进入企业网层层防护关卡。要想知道每个数据包中携带了什么内容,普通的摄像头已经失效,需要更强大的X透视相机-进行协议分析,只有准确理解事物的本质,才能对症下药,Shellcode攻击(下图是shellcode和botnet的实例)和各种蠕虫也是如此。

现在随着IT运维管理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业开始需要运用专业化、标准化和流程化的手段来实现运维工作的自动化管理。因为通过自动化监控系统能及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然。例如,全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。而且,通过自动化诊断能最大限度地减少维修时间,提高服务质量。因此, 对于越来越复杂的IT运维来说,将纯粹的人工操作变为一定程度的自动化管理是一个重要发展趋势。

勤智运维磨砺多年,深刻理解IT运维“建设易,管理难”的特点和ITaaS背景下的服务转型阵痛,结合多年运维实践及对ITSS国家标准的制定与理解,推出OneCenter一体化智能运维管理平台,将“监控、管理、治理”三方面有机融合。

运维监控工具几乎是每个企业都必须的,它可以在达到较高运维质量的同时基本不增加运维的人力成本。开源的运维监控工具如Nagios等更适用于精通Linux、很专业的运维工程师。选择商业工具时,可以根据企业的具体情况和产品的特色来决定。比如如果需要监控一些比较新的开源软件,蚁巡运维平台几乎是唯一的选择。

图片 2

首先,IT运维流程自动化能够提高流程的可控性,可以基于业务需求来制定个性化的流程,使企业领导有机会看见他们的业务流程,对企业流程有一个深刻的分析和理解,进而改造和优化流程。

OneCenter一体化智能运维管理平台可以让IT监控运维智能、高效、简单、统一,帮助运维团队实时、全面掌握IT运行态势,及时响应和处理IT故障,为各企事业单位业务提供强有力的IT支撑和质量保障。

本文由胜博发-运维发布,转载请注明来源:应该从以下几个角度考虑如何选择和建设运维管