全球主机论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 59|回复: 0

数据库监测怎样在客户发觉之前解决问题

[复制链接]
发表于 2017-8-22 14:52:13 | 显示全部楼层 |阅读模式
数据库监测怎样在客户发觉之前解决问题
编辑寄语:在三个系列的文章中,我们介绍了数据库监测的不同方法,通过数据库监测可以您帮助改善app性能和实用性,在线用户体验,工程建设以及发展团队生产力。在本文中,我们将重点为您介绍主动监控数据库服务器和在线用户体验。
像谚语“冰山一角”一样,你的数据库问题可能会隐藏在表面和视线之外。 当您一眼看上去似乎毫无波澜,只有一个清晰可见故障提示,但在冰山之下可能潜伏着重重危机。因此您需要预测出可能发生什么问题,以便于采取正确的修正措施。在问题仅仅是雷达屏幕上的一个警告点时,及时采取修正措施要比等到大难临头时容易得多。
对于数字企业来说,潜在的数据库问题可能会导致其网站性能下降,客户体验变差进而导致高放弃率。 作为存储和任务执行的关键机制,数据库直接关系着系统的高性能和客户满意度。优秀的客户体验应该让客户就根本注意不到网站的性能如何,因为他们认为一切都能够完美无瑕。为了实现该目标,您必须能够快速发现和修复问题,而且可以在客户意识到问题存在之前主动监控和预防问题。
您需要对数据库的功能有全面的了解,需要知道应该重点关注哪些指标,还需要能够对发现的信息进行解释,以便采取正确的行动。
服务器故障
数据库服务器经常会在短时间内局部或整体暂停运作。 当这种情况发生时,过往的查询没有完成,新到达的查询任务却已经不断堆积了起来; 现有连接无法工作,但新连接又在继续打开。不良效应层层叠加,大量的连接被打开,许多查询任务同时运行,查询延迟尖峰和服务器负载显著增加。 如果服务器故障持续时间过长(一分钟或更长时间),那么就很有可能会出现服务器资源耗尽的情况(例如无法打开新连接或运行内存不足甚至崩溃)
关于故障,有两方面重要的事情您需要知道:
1. 这些故障随时都在发生,只是大部分人不知道而已。关键不在于故障是否会发生,而在于会持续多长时间。对运作良好的服务器来说,您肯定希望故障只持续几毫秒的时间。但如果运作出现问题,而服务器的负荷和数据又在不断增加时,故障就会持续1秒,10秒甚至更长时间。大部分人在此之间都不会意识到情况出错,直到服务器故障已经变得十分严重(中断服务10秒以上)【相关文章推荐:主机cn.bluehost.com】
2. 这种服务器中断故障很难提前被诊断出来,而且会有上百种的诱发因素。当有人注意到服务器中断时,故障原因通常十分复杂。一时间所有事情都出了错,以至于您无法辨别出最初的问题的什么。除此之外,服务器中断通常没有规律性,而且通常不可能立即发现。
您需要在服务器中断时间还很短的时候(1秒或1秒以下)就尽早发现,由此您需要捕获整个服务的大量数据。这两件事情想要真正完成都很难,但是一旦做到了,您就可以有效预防以后发生严重故障的可能。
系统故障(如停顿)几乎不可能通过诸如基于阈值的警报之类的正常手段进行检测。 直到它们的问题愈发严重之前(几秒或几分钟的停机时间),它们往往很难被发现,并且非常难于诊断其根源。因为停机的短暂性,使得它们难以观测。 而系统故障的症状和原因往往是复杂的,因为同时以各种方式失效的系统通常是异常行为。 由于这些原因,您应该在故障持续时间较短时进行检测(一秒或两秒),这意味着您需要主动监测服务器运作,因为短期故障更容易诊断和修复。
主动监测
数据库监控中的主动性意味着在事件发生之前预防问题,而大多数服务器性能监控主要都集中在快速的事后检测。 但是,您可以采取一些方法来让自己更具主动性:
§ 早期检测是关键。 当问题太细微容易被顾客忽视时,您要善于发现刚催发出的问题,并把它揪出水面,此时的服务器故障还很小,很容易诊断解决。 服务器停顿和查询延迟之类的问题具有“黄金诊断时间”,因为随着故障发生,问题就会不断累积恶化,导致难以诊断。
§ 在预生产环境中检测。 您要能够监控预生产和生产部署中的服务器性能。 这意味着您要具有工作负载分析能力,以便在生产前环境中各项部署落实后,还能应对某些重大变动。 您还需要用文本分析来突出可能不会在分段运输中显示的问题,但这些问题可能会导致生产故障。 在运送生产之前,在分期环境中发现问题是一种有效的可避免服务器中断的方法。
§ 切断急救措施。 使您的团队主动监测数据库最佳方法就是连接反馈回路,粉碎贮仓,并使整个团队专注于预防和解决问题之中。 没有这种思维转变,那些在生产中运行系统的人注定要永远处于被动的反应模式里,与没有早做预防的问题做斗争。 但是,当整个团队了解生产数据库的运作时,数据库应用系统(DBA)就能够承担更多的战略性工作。因此我们应该防止明天可能会出现的问题而不是解决今天的问题。
结语
早期检测可以防止未来的问题。 这种在数据库运行当中短暂的服务器故障预示着可能存在重大隐患,所以在分析中更加细化并保持主动性将有助于您将尽早发现问题所在,并能在事情恶化之前进行正确的修补。 最重要的是,以稳定的正常运行时间和良好的客户体验,您的客户将会体会到您的出色工作。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|小黑屋|全球服务器论坛

GMT+8, 2024-10-10 20:22 , Processed in 1.669203 second(s), 19 queries , File On.

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表