服务器运行时,如果出现故障服务器是否还能正常运转,且业务不会中断运行,这时候就会确认服务器容错如何?如果用户的网站、应用程序或网络系统没有适当的容错机制,那么一旦系统中的一个组件停止工作,那么用户的业务可能立即崩溃。 “容错”,顾名思义是服务器对于系统运行中产生的错误、故障的容纳、纠错能力,它是企业级应用中对于服务器稳定性追求的目标。人们俗称的99.999%就是对于服务器系统高稳定性诉求的直观体现。容错服务器能够允许出现一定的错误(故障),这些服务器通常都具备有自动修复和支持冗余的功能模块。当错误或者故障出现的时候,这些出错的部件可以得到及时的修复或者切换,从而确保服务器不间断运行。容错服务器通常对CPU、内存、磁盘和网卡甚至电源实现冗余备份,在任何部件出现问题的时候都不会造成系统宕机和数据丢失。目前很多基于工业标准的服务器都能实现这种冗余容错机制,而且是以更具成本优势的方式来实现。 一、服务器的电源供应 确保服务器拥有冗余的电源供应,包括企业级不间断电源、定期检测的备用发电机等。如果数据中心没有冗余电力,可能导致服务器中断运行。 二、服务器硬件冗余 无论租用什么服务器,服务器硬件和网络硬件都应该是以冗余的方式构建。其中,以香港服务器租用为例,逐渐接入各种各样的线路比如BGP线路,CN2线路等以满足用户的各种需求。且一般用户可部署RAID磁盘阵列,可提供更高的数据可靠性。 三、服务器软件更新 服务期内的软件保持更新,尤其是与安全相关的内容。有很多服务中断是由应用程序故障引起的,而且未及时更新版本和安全补丁,会更容易被黑客入侵进而导致更严重的损害。 四、服务器硬件故障监控 针对硬件设施提供密切的监控是不可缺少的。在使用服务器时,用户应当随时保持对服务器硬件和软件的关注,并确保在突发故障时可以即时提醒。 五、降低人为操作的失误率 在实际使用服务器过程中,有些故障可能是因为应用程序故障、系统缺陷以及人为错误操作导致的。因此,服务器管理水平也需要提高。 随着信息化的不断深入和业务的发展,服务器的作用对企业来说显地更为重要。如何维护服务器才可以保证7*24全天候稳定运行,这也成为企业思考的问题。
|