管理应用的可用性和性能。
早期的识别和解决方式的关键是减少应用问题的影响。通过正确的监测,很多应用问题可以在停机前被发现和解决。
最终用户的体验监测是应用监测的重要部分。最终用户的响应时间应该一直被测量,并与现有的服务等级协议比较,在问题变得严重之前,能帮助识别和解决性能变化趋势。
现在我们可以采用先进的技术帮助组织捕获,分析和回放完整地最终用户会话。这样的数据对于再现和诊断与应用功能相关的问题而言是非常重要的。这些技术可以被用来分析电子商务和其他自助服务Web应用的可用性问题。
除最终用户的体验数据外,资源利用情况和性能数据应该根据应用技术栈的层次进行采集,包括Web Server,应用服务器,数据库和网络。这些数据可以在情况变得严重前提供有关问题的重要信息。例如,缺少一个索引导致的性能问题,只有在过量的表扫描时才能采集到特征数据。在对最终用户产生严重影响之前,表扫描监测应该很早就可以发现这个问题。与此类似,Java应用中的内存泄露问题往往很长时间都不会被发现,通过监测内存使用就可以在灾难之前发现这种问题。对相关组件(包括网络,操作系统,应用服务器,数据库和应用等)的细粒度监测和报警,通常可以在停机前发现应用的问题。
即使采用最好的,能够尽早报警的系统,有时应用也会很快出现问题,导致严重的性能下降甚至停机。这时,公司才会切实感觉到销售额的下降或成本的显著上升。不幸的是,在这种情况下,诊断问题是很困难的。在当前的复杂应用环境中,一个问题可能与很多变化的因素有关。下面是一些造成应用响应时间突然下降的可能原因:
更改应用代码后未经优化
未经优化的SQL语句
意外删除的索引
意外的数据库资源竞争
Java内存泄露
Web服务器进程数量过多
网络性能问题
识别像上面的这些困难问题可能需要多种IT技术。重要的是技术人员应该方便地掌握恰当的数据以便快速缩小问题的可能性。技术人员应该能够快速察看应用,应用服务器,数据库,Web服务器,操作系统和网络的性能和资源特征,并可将这些数据与具体的交易响应时间的下降相关联进行综合分析。拥有合适的工具以简明的方式提供数据时快速解决问题的关键。
3.结论
商业组织必须不断地适应变化的市场环境。这给IT部门带来很大压力,必须保证公司的应用系统可以支持全面的战略方向。因此,将面对更为复杂的一个用环境。没有正确的控制和管理,应用环境的持续改变将导致糟糕的应用性能和停机。对于一个组织来说,这些问题意味着销售额和生产效率的大幅降低。Gartner估计任务关键应用的每小时停机成本是42,000美元。而通过在应用的整个生命周期(从开发到生产)中采用严格的方法,可以避免大量的损失。采用适当的工具,谨慎地控制工作流程可以俄日大多数IT部门节省巨额成本。
转贴于:http://www.leadge.com