blog » 架构设计 » 数据中心服务器选型有术

数据中心服务器选型有术

传统以数据为中心构造的数据中心已不能完全适应现代IT架构的发展,下一代数据中心将是真正的服务导向架构,具备充分的灵活性和可扩展性。服务器作为计算核心,是数据中心最重要的硬件设备之一。用户能否选好服务器直接关系到数据中心建设的成败。

在服务器选型时,用户不仅要考虑服务器本身的特性是否适合于下一代数据中心的建设要求,还需要注重多种新技术与服务器产品的结合运用,以满足下一代数据中心的要求。

架构选择量体裁衣

根据业务类型确定服务器的处理器架构是用户选型的第一步。目前处理器架构主要分两大类:一是基于复杂指令集(CISC)架构的处理器以及主要应用于UNIX系统中的精简指令集(RISC)架构处理器。

CISC架构的代表是英特尔的至强系列处理器,它们的最新产品都支持64位。英特尔至强处理器具有成熟的商业优势,各种软硬件对其进行优化,使其具有极高的商业性能而不存在兼容性问题,也是目前应用最广的一个服务器处理器系列,具有较高的市场占有率。

以上服务器处理器主要应用于主流市场,更为高端的市场中主要应用的还是由Sun、HP、IBM等公司开发的RISC架构处理器及IA架构的安腾处理器。

选择哪一种处理器架构要视具体应用需求和经济承受能力而定。就下一代数据中心而言,处理器架构的确定要根据数据中心的服务职能来确定。电信、银行、政府、企业等数据中心所提供的服务并不完全相同,不能像传统的数据中心以数据为中心进行架构选型。比如银行数据中心对服务器的可用性和可靠性要求极高,并且为了保证系统的安全性,其核心业务可以考虑基于RISC架构的服务器系统,但因其具有一定的封闭性,安全性较差。用此类服务器构建数据中心建设与维护成本较高,并不一定适合于其他行业的数据中心。

目前基于CISC架构的处理器已经发展到四核,英特尔即将推出六核至强处理器,其性能大为提高。微软的Windows Server系列操作系统和开源的Linux系统经过多年发展,其功能和稳定性也有了很大提高。对于大部分的政府和企业应用完全可以满足需求。比如企业ERP系统、政府电子政务系统等商业计算系统,最为注重的是系统稳定性,采用基于英特尔成熟的至强系列处理器可以带来良好的应用效果。对于石油勘探、气象预报等需要做高性能计算的应用领域,IA处理器也已经占据了绝对主流,这在最新的HPC TOP500榜单中已经体现出来。

浪潮拥有全面的HPC和HPS两大高性能计算产品线,他们分别是TS10000、TS20000、TS30000,被命名为“天梭系列”。他们的出现打破了国外厂商小型机的技术与市场垄断,极大的降低了拥有成本,推动了我国信息化的高端发展。

类型选择视负载而定

确定好下一代数据中心的服务器架构之后,用户就该根据业务的规模、负载、未来增长状况来确定服务器的性能。按性能标准划分,服务器通常被分为入门级服务器、工作组级服务器、部门级服务器和企业级服务器4个档次。服务器的档次最主要的决定因素还是处理器,用户在对服务器进行性能选型时,需要从处理器类型和可扩展处理器个数两方面来分析选型。

对于中小型的数据中心,我们可以选择基于英特尔至强系列的入门级服务器,它们一般支持1~2路处理器,可以满足大部分中小型用户的扩展需求,而且价格很经济。对于有一定规模的中型数据中心,建议选择基于英特尔至强多路工作组或部门级服务器,这是目前最主流的配置。它们可部署4路对称处理器,完全可以满足中型企业的应用和扩展需求。服务器价格根据不同路数处理器而相差较大,标准2路配置价格比前面介绍的2路服务器也会高出许多。

对于一些大型数据中心,或者主要应用于那些复杂商务应用的企业,如电信、金融、证券等行业的核心业务系统,建议选择基于英特尔至强系列处理器平台的高性能集群系统。它没有小型机不菲的价格,但具有小型机的高可靠性和高可用性。而且后期服务、维护等成本低廉。

除了处理器,用户还需要对内存和硬盘的类型、容量以及工作模式进行选型。这两方面的选型,以及冗余电源等服务器其他方面选型都要根据具体服务应用来确定,并不遵从于传统的以数据为中心的数据中心的固定选型模式。

浪潮NF560D2是目前市场上一款极具特色的高性价比产品。它是专门针对中国市场设计的4路对称处理器产品,在设计时充分考虑了中国数据中心的实际情况,优化了产品,使其不但拥有强大性能,更具备完善功能。

用刀片提高计算密度

传统的塔式服务器和机架式服务器已经很难满足下一代数据中心对计算密度的要求,刀片服务器作为一种新兴的服务器结构,将成为下一代数据中心的主力服务器结构。它能整合数据中心基础设施、简化线缆和优化管理、高性价比等优点。刀片服务器大小仅为标准的1U服务器几分之一,并且需要电能更少,安装在使它们共享资源的专用机箱中,部署刀片服务器将得到节省空间成本的回报。刀片服务器能在每机架单位上达到10GHz的计算能力,而在使用传统平台时,每机架单位实际为0.5GHz的计算能力。

高密度的服务器部署与数据中心机房、机柜能提供的有限电力供给形成了矛盾,数据中心正经受着能源供给和计算效率的双重困惑。一般的刀片服务器都是7U高,这样一个42U高的标准机柜可以容纳6组刀片服务器,每组插满时按14个刀片计算,相当于要放进84个以上的刀片,如果按照每台功耗300瓦计算,消耗的整体功耗将达到25千瓦以上,而目前大多数标准机柜能够提供的电力也就在10千瓦到15千瓦之间,距离满负荷刀片部署的要求仍然有很大的差距。因此节能环保也是服务器选型时需要重点考量的因素。

节能服务器前景广阔

节能型服务器多数采用节能型处理器,大幅度降低能耗。但处理器功耗一般占服务器系统功耗的1/3左右,单一使用低功耗处理器还不够。存储、内存、通信甚至是散热部件工作都要消耗大量点能,因此要想控制数据中心的服务器能耗,就必须综合考虑这些因素。采用SSD(固态硬盘)取代传统硬盘已成为未来的趋势。SSD不但节能,还能大幅提高I/O速度;另外,未来服务器还将采用新一代DDR3内存;英特尔还准备在x86服务器中采用FCoE(通过以太网运行FC协议)技术,这些都将进一步降低系统功耗。

除了这些节能型芯片和组件使用,其内部散热结构设计也很重要。众所周之,服务器的能源消耗仅占数据中心能源消耗的一半左右,另一半就是数据中心散热系统的能源消耗,因此,选择节能型设计与优化散热设计的服务器将更加符合下一代数据中心的要求。我们不必一味追求高性能处理器,因为高性能处理器必然带来高能耗。以往,行业用户对服务器升级认可的周期一般是在4~5年,如果一台服务器功率节省40瓦,连续运行不到两年,服务器升级成本即可收回,而两年后的服务器必将更加节能高效。

此外,减少运行的服务器数量也可以明显减少电力成本。因为一台服务器生产量为30%时消耗的电能不比生产量为60%时少,整合服务器和提高利用率也可明显减少电力消耗。因此,对于下一代的数据中心,高利用率将是我们对服务器选型的一项重要的关注点。通过数据中心服务器的虚拟化技术可以将众多闲置的服务器资源整合起来,从而减少物理服务器的数量,达到缩小机房使用面积,减少管理成本,节省电能和冷却成本等诸多优点。在为数据中心进行服务器选型时,服务器硬件对虚拟化技术的支持将有效提高虚拟化技术的应用效能。

浪潮作为领先的服务器厂商,非常注重节能降耗的设计,已经有了一系列的绿色环保型的产品,如最新的刀片服务器NX7140D,节能型服务器NF285E等。全系列服务器产品更是列入了国家节能产品推荐名录。

不要忽视易管理性

数据中心的日常管理工作,也是我们对于数据中心服务器的一个重要考量指标。服务器管理自然离不开软件的维护与支持,目前绝大部分服务器在出厂时,厂商都会为其搭配相应的服务器管理软件,来加强服务器的安装、调试、维护等环节,节约管理时间。别小看随机配套的管理软件,有必要的硬件支持,管理软件可以实时监测系统状态自动报警,可以让用户远程管理和数据备份。特别是对于大规模和全国部署的IDC用户,管理软件节省的成本可想而知。用户选型时应该注意服务器是否具有BMC芯片,实现统一的管理功能。

管理软件也是必须考量的一个重要方面,拥有强大管理功能的软件可以大大提高数据中心的工作效率和服务质量。

除此之外,对于数据中心而言,良好的服务极具价值。特别是大型数据中心,由于大量采用单一型号,单一配置的服务器,如果服务器厂商提供预装操作系统、现场实施等服务,将带来极大便利,对于这些特殊需求,浪潮公司甚至能提供厂家级个性化设计与定制化生产服务。

PC服务器选型指导

对于一个企业来讲,选择适应本企业需要、性能良好的PC服务器是相当重要的。因为服务器承载着企业的核心应用,它直接决定着企业网络能否正常运转和稳定工作。所以,选择PC服务器时,应关注设备在可管理性、可用性、可扩展性等方面的作用。当然,用户还应关注系统软硬件的网络监控技术、远程管理技术、产品的售后服务等。

综合因素的选择

用户在选择PC服务器产品时首先要结合自身的应用对服务器本身有一个全面的了解,比如服务器是用作数据库服务器、邮件服务器、还是Web服务器?等等,然后才好对症下药。

首先,要了解服务器所执行的任务和作用。如果只是提供文件和打印共享,对服务器是一个相对较轻的负荷。这时,CPU速度是必要因素,用户可以优先考虑磁盘子系统和网络I/O的性能。另外,文件服务器对内存的要求也相对较低。而应用服务器所有的需求均比文件服务器要高,具体体现在更强的处理器能力,因为用户程序大部分是在服务器运行。可以考虑采用适当数目的CPU构成SMP或采用群集技术来提高处理能力;采用更多的内存,以支持用户程序在服务器中运行;使用更多高性能的磁盘,一个应用服务器通常要运行大量频繁访问磁盘的数据库应用;采用更加健壮的操作系统,能够对大量用户的并发操作作出有效的响应而不会崩溃。

其次,要考虑网络的规模和用户的数量。显然,在一个对应用服务器要求不高的小型网络中和在一个有数百客户使用共享文件和打印机的大型网络中,后者文件服务器的性能通常要高出前者的应用服务。小型用户因为网络规模小,任务关键程度低,任务负载集中,因此对服务器的价格较为敏感,对于服务器的性能要求较为宽松。一般要求服务器有一定的扩展能力,能与老的系统保持兼容,对安全性要求不高,要求数据备份,对容错要求不多,对服务器的可管理性要求也不高。

中型用户的网络规模较大,任务关键程度中等,任务负载较分散,因此对服务器性能的要求较高。从保护投资角度出发,要求服务器有较好的扩展能力,以便将来业务扩大,网络规模扩展时,已有的投资能满足更高的要求。另外,中型应用对服务器的安全要求较高,既要求有数据备份,也要求有数据容错,对其管理性要求较高,需要一些专用的管理和配置软件。

大型用户的网络规模很大,任务关键程度很高,且负载分散,网络管理工作繁重,因此对服务器的要求很高,同样要求服务器具有良好的扩展能力以保护已有的投资和满足业务增长后的需求。大型应用对数据存储和传输要求也很高,要求服务器不但应具有高速的I/O能力,而且应具有良好的容错能力。对服务器的可管理性和负载平衡要求也非常高,服务器厂商也都会提供专用的管理和配置软件。综上所述,用户应根据本身应用需求和将来的业务发展选择适当的服务器产品,以达到最优的性能价格比。

硬件方面的选择

由于服务器本身硬件配置复杂,不同硬件对系统的作用和影响也各有不同,因此必须总体考虑。在选择不同硬件配置时,用户应当根据自身网络的特点和要求来作决定。

■可扩展性

选择PC服务器时,用户首先应考虑系统的可扩展能力,即系统应该留有足够的扩展空间,以便于随业务应用增加对系统进行扩充和升级。这种可扩展性主要包括处理器和内存的扩展能力(比如有没有多余的CPU接入槽口,有几个内存条插槽,是否支持内存频率从100MHz提升到133MHz等)、存储设备的扩展能力(比如SCSI或IDE卡可支持多少硬盘,这些硬盘接口数量是否满足需求等)以及外部设备的可扩展能力等等。

■易用性

由于PC服务器的体系结构沿用了PC机的IA架构,所采用的核心部件如处理器、内存和硬盘等也都与PC机相似,因此它的安装过程和操作方式也有点象PC机那样简单。虽说简单,却也并非傻瓜,特别是这类服务器普遍引入了复杂的SCSI接口和RAID功能,所以易用性仍然是用户在选择时必须关注的问题,这主要表现在是否包括详细、全面而又易于查阅的各类文档;是否具有在线查询的用户导航软件;是否容易获得系统运行状态的各种信息;是否预装有可以对整个系统运行状况进行监控和报警的管理软件;是否具有可使用户易于对系统进行维护的详细指导资料等。

■可管理性

作为一个关键指标,可管理性直接影响到用户使用PC服务器的方便程度。良好的可管理性主要包括人性化的管理界面;硬盘、内存、电源、处理器等主要部件便于拆装、维护和升级;具有方便的远程管理和监控功能;具有较强的安全保护措施等。PC服务器的故障主要来自硬盘、电源、风扇等功率部件,若这些部件出现故障而造成停机或是数据丢失,那么这样的PC服务器的可管理性可以说是非常差的。在正常的情况下,系统必须支持这几类部件有可能出现故障时的隐患提示信号,如硬盘故障隐患指示灯、电源故障隐患指示灯等

■ 可用性

关键的企业应用都追求高可用性服务器,希望系统24×7×365不停机、无故障运行。有些服务器厂商采用服务器全年停机时间占整个年度时间的百分比来描述服务器的可用性:若可用性大于99.99%,实际上就是要求服务器的每年停机时间不得超过53分钟;若要求可用性大于99.999%,就意味着每年停机时间只有5分钟。除了降低MTBF以外,当前有些服务器还大大降低了MTBR(平均修复时间),使可用性进一步提高。这项描述指标中9的位数越多,产品的可用性越高。尤其象银行、证券等用户对高可用性的要求尤为强烈。

实践证明,影响PC服务器可用性的原因主要有硬件故障、操作系统和应用软件故障、操作失误和环境故障三类。众所周知,服务器是一个由高速电子电路和精密机械组成的复杂系统,不但电子部件和机械部件之间存在着可靠性的差异,就连电子电路的可靠性根据其工作状态不同也存在一定差异。比如,工作在高电压和大电流状态下的功率部件的可靠性较低,而相反地,工作在低电压和小电流状态下的功率部件的可靠性则较高。又如,工作在高温度环境中的高发热部件的可靠性较低,而工作在低温度环境下的低发热部件的可靠性就高多了。PC服务器的电源就是高电压、大电流部件,另外处理器工作时的发热量也较大。另外,机械部件还存在磨损,因此它们的平均无故障工作时间要大大低于电子部件,现在广泛使用的高转速、大容量硬盘不仅因为转速高会导致磨损快,还会引起高发热现象。所以,用户在选择PC服务器时,应务必多关心这些部件的性能。

目前,提高可用性的一个普遍做法是部件的冗余配置。硬件的设备冗余通常支持热插拔功能,如冗余电源、风扇等,可以在单个部件失效的情况下自动切换到备用设备上,保证系统运行。RAID技术可保证硬盘出现问题时在线更换,保证数据的完整性。此外,独特的硬件管理总线(I2C)技术利用专门的硬件管理机制,可在系统出现异常情况时(如机箱温度超标、内存出错、机箱被异常开启等)迅速提出警报和予以处理。一般来说,PC服务器的冗余方案主要是磁盘、电源、网卡和风扇的冗余配置,有些产品还支持操作系统和应用软件的备份,并包含有用于数据紧急恢复的系统模块,从而大大提高了系统的可用性。

磁盘冗余实际上就是指系统支持RAID技术,可通过对多个硬盘进行处理,使得同样的数据被均匀地分布在多个盘上并加入校验数据,当有硬盘损坏时,系统可利用重建功能将已损坏硬盘中的数据恢复到更新的硬盘上。比如,在采用了RAID5技术并配置了4个硬盘的冗余系统中,由于一个硬盘仅仅作为校验盘用,实际上用来保存数据的硬盘就只有3个了,而当一个硬盘损坏后,其它2个硬盘就会将损坏的数据恢复到更换的新硬盘中,但若2个硬盘同时损坏,那么恢复重建工作就无法进行了。当然,RAID技术还可提高系统的I/O性能,因为用户可以通过配置热插拔硬盘来避免由于硬盘损坏而造成的停机故障。

PC服务器的电源冗余一般是指配备双份支持热插拔的电源。这种电源在正常工作时,两台电源各输出一半功率,从而使每台电源都处于半负载状态,这样有利于电源稳定工作,若其中一台发生故障,则另一台就会在没有任何影响的情况下接替服务器的工作,并通过灯光或声音告警。此时,系统管理员可以在不关闭系统的前提下更换损坏的电源。所以,采用热插拔冗余电源可以避免系统因电源损坏而产生的停机现象。

网卡冗余是指在服务器的插槽上插了两块网卡,但必须是采用了自动控制技术的冗余网卡。在系统正常工作时,该双网卡将自动分摊网络流量,提高系统通信带宽,而当某块网卡出现故障或该网卡通道出现问题时,服务器的全部通信工作将会自动切换到好的网卡或通道上。因此,网卡冗余技术可保证在网络通道故障或网卡故障时不影响正常业务的运转。需要指出的是,许多用户在选购了支持双网卡冗余系统的设备后,因为觉得网卡不是功率部件,出现故障的几率很少,且使用双网卡就需要布双份网线,所以实际真正应用的不多。这里希望用户在选择了具有网卡冗余功能的服务器后,最好能够进行相应配置,这不仅是出于充分利用设备的原因,更是因为服务器上的网卡一旦损坏,网络瘫痪将是无庸置疑的。

风扇冗余是指在服务器的关键发热部件上配置的降温风扇有主、备两套,这两套风扇具有自动切换功能,支持风扇转速的实时监测,发现故障时可自动报警,并能启动备用风扇。若系统正常,则备用风扇不工作,而当主风扇出现故障或转速低于规定要求时,备用风扇马上自动启动,从而避免由于系统风扇损坏而导致系统内部温度升高,使得服务器工作不稳定或停机。

软件方面的选择

用户购买服务器时要对操作系统的兼容性予以注意,大部分PC服务器都流行安装Windows NT,但这些产品一般也对Novell NetWare、Sun Solaris、SCO Open Server、Linux等操作系统平台提供支持。很多PC服务器都有自己的管理软件,比如联想的万全导航管理软件,可以帮助用户安装操作系统、进行系统设置和诊断,有效而且实用;又如COMPAQ的Insight Manager系统管理工具,可满足多种服务器管理中的设置、功能监测和错误预报等需要。这些管理软件是用户与服务器交互的直接界面,用户可以通过它监测服务器目前的工作状态并能根据出现的问题及时采取措施,保证服务器的正常运转。因此在选择服务器时,用户应该特别注意系统所带的各类软件和这些软件的特点,以适应自己网络的应用。

售后服务

售后服务可以说是当今所有IT产品都重视的内容。有些厂商为了吸引更多的用户,提出了7×24小时的无缝全天候服务咨询,且市内上门服务2小时、远程上门服务24小时的严格承诺,彻底消除了用户选择服务器的后顾之忧。其实,有经验的用户在选购PC服务器时,对售后服务内容的看重甚至仅次于设备的可用性要求,因为较好的售后服务是对用户投资的可靠保证,尤其是技术力量与维护能力有限的企业,在后期应用中需要大量的技术支持,而显得更加的重要。

总之,用户应该对上述几个方面综合考虑,选择真正符合自身需求的PC服务器。

[整理自网络]

This post has already been read 958 times!

Related posts

RSS 2.0 | leave a response | trackback

发表评论