集群技术是什么,第1张

集群技术是一种相对较新的技术,能够以较低的成本获得较高的性能、可靠性和灵活性,其任务调度是集群系统的核心技术。

集群技术是一种相对较新的技术,能够以较低的成本获得较高的性能、可靠性和灵活性,其任务调度是集群系统的核心技术。

集群技术是什么,集群技术是什么,第2张

集群是由高速网络互连的一组独立的计算机。它们组成一个组,以单一系统模式进行管理。当客户端与集群交互时,集群就像一个独立的服务器。集群配置用于提高可用性和可扩展性。

目的

1提高性能

一些计算密集型的应用,如天气预报、核试验模拟等,要求计算机具有很强的计算和处理能力,现有技术是普通大型机器难以计算的。此时一般采用计算机集群技术,将几十台甚至几百台计算机的计算能力集中起来,以满足需求。提高处理性能一直是集群技术研究的重要目标之一。

2降低成本

通常,一个好的集群配置在硬件和软件方面的成本超过100,000美元。但是,相对于价值数百万美元的专用超级计算机来说,还是相当便宜的。在达到相同性能的情况下,采用计算机集群比采用同等计算能力的大型计算机具有更高的性价比。

3提高可扩展性

如果用户想扩大系统容量,就必须购买性能更高的服务器,以获得额外的CPU和内存。如果采用集群技术,只需向集群中添加新的服务器。对客户来说,服务在连续性和性能上几乎没有变化,就好像系统在不知不觉中升级了一样。

4增强可靠性

集群技术使系统即使在发生故障时也能继续工作,从而最大限度地减少系统停机时间。集群系统不仅提高了系统的可靠性,而且大大降低了故障损失。

分类

1个科学集群

科学集群是并行计算的基础。一般来说,科学集群涉及为集群开发的并行应用程序,以解决复杂的科学问题。从外部来看,科学集群就像一台超级计算机,它由十到数万个独立的处理器组成,在公共的消息传递层上进行通信,以运行并行应用程序。

2负载平衡集群

负载平衡集群为企业需求提供了更实用的系统。负载平衡集群使负载尽可能均匀地分布在计算机集群中。负载通常包括应用程序处理负载和网络流量负载。这样的系统非常适合为大量使用同一组应用程序的用户提供服务。每个节点都可以承受一定的处理负载,并且可以实现节点间处理负载的动态分配,实现负载均衡。至于网络流量负载,当网络服务程序接受了较高的网络流量,以至于无法快速处理时,那么网络流量就会被发送给运行在其他节点上的网络服务程序。同时,可以根据每个节点上不同的可用资源或网络的特殊环境进行优化。与科学计算集群一样,负载均衡集群将计算负载分布在多个节点上。它们之间最大的区别是缺少一个跨节点运行的单一并行程序。在大多数情况下,负载平衡集群中的每个节点都是运行独立软件的独立系统。

但是节点之间有一个共同的关系,无论是直接相互通信还是通过中央负载均衡服务器控制各个节点的负载。通常,使用特定的算法来分配负载。

3高可用性集群

当集群中的一个系统出现故障时,集群软件会迅速做出响应,并将该系统的任务分配给集群中的其他工作系统。考虑到计算机软硬件的易错性,高可用性集群的主要目的是使集群的整体服务尽可能可用。如果高可用性群集中的主节点出现故障,在此期间它将被辅助节点替换。辅助节点通常是主节点的镜像。当它取代主节点时,它可以完全接管自己的身份,从而使系统环境对用户来说是一致的。

高可用性集群使服务器系统的运行速度和响应速度尽可能快。他们通常使用运行在多台机器上的冗余节点和服务来相互跟踪。如果一个节点出现故障,它的替代节点将在几秒钟或更短时间内接管其职责。因此,对于用户来说,集群永远不会停止。

在实际使用中,这三种类型的集群相互融合。例如,高可用性集群还可以在其节点之间平衡用户负载。同样,您可以从要编写应用程序的集群中找到一个并行集群,它可以在节点之间执行负载平衡。从这个意义上说,集群的分类是一个相对的概念,而不是绝对的。

系统结构

根据典型的集群架构,集群中涉及的关键技术可分为四个级别:

(1)网络层:网络互联结构、通信协议、信号技术等。

(2)节点机和操作系统是高性能客户端、分层或基于微内核的操作系统等。

(3)集群系统管理层:资源管理、资源调度、负载均衡、并行IPO、安全等。

(4)应用层:并行程序开发环境、串行应用、并行应用等。

集群技术是以上四个层次的有机结合。虽然所有相关技术解决的问题不同,但都有其不可或缺的重要性。

集群系统管理层是集群系统独特功能和技术的体现。在未来的按需计算时代,每个集群都应该成为业务网格中的一个节点,因此自治(自我保护、自我配置、自我优化、自我处理)也将成为集群的一个重要特征。自主性的实现和各种应用的开发和运行大多直接依赖于集群的系统管理层。此外,系统管理的完善程度决定了易用性、稳定性、可扩展性等诸多关键参数。是集群管理系统将多台机器组织起来,使它们可以被称为“集群”。

调度方法

1流程迁移

进程迁移是将进程从其当前位置移动到指定的处理器。它的基本思想是在执行过程中移动一个进程,使其可以继续访问其所有资源,在另一台计算机上运行,并且可以在不知道正在运行的进程或任何与其他进程交互的进程的情况下启动进程迁移操作,这意味着迁移是透明的。进程迁移是支持负载均衡和高容错的一种非常有效的手段。对一系列负载均衡策略的研究表明,流程迁移是负载均衡的基础,流程迁移在很多方面都是适用的。

(1)动态负载均衡。将流程迁移到负载较轻或空空闲的节点,充分利用可用资源,通过降低节点间的负载差异来全面提升性能。

(2)容错性和高可用性。当一个节点出现故障时,流程会迁移到其他节点恢复运行,这将大大提高系统的可靠性和可用性。这在一些关键应用中尤其重要。

(3)并行文件IO。将进程迁移到文件服务器进行IO,而不是通过网络将数据从文件服务器传输到进程。对于那些需要向文件服务器请求大量数据的进程,通信量将得到有效减少,效率将大大提高。

(4)充分利用特殊资源。流程可以迁移,以利用节点上独特的硬件或软件功能。

(5)记忆引导机制。当一个节点耗尽其主内存时,内存引导机制将允许该进程迁移到具有空空闲内存的其他节点,而不是使该节点频繁分页或与外部内存交换。此方法适用于负载平衡但内存使用或物理配置不同的系统。

2.流程迁移的实现角度

进程迁移的复杂性及其对OS的依赖性阻碍了进程迁移的广泛使用,尤其是透明进程迁移的实现。根据应用级别,进程迁移可以是OS的一部分,用户空,系统环境,也可以是应用程序。

(1)用户级迁移:用户级实现相对简单,软件开发和维护也相对容易。所以现有的很多系统都是在用户层面实现的,比如Condor和Utopia。但是,由于不能在用户级别获得内核的所有状态,因此无法迁移某些进程。另外,由于Kernel 空和User 空之间存在隔阂,要打破这个界限,获得Kernel提供的服务,需要巨大的开销。因此,用户级实现的效率远远低于内核级实现。

(2)应用级迁移:应用级迁移的实现相对简单、可移植,但需要理解应用的语义,可能需要修改或重新编译应用,透明度差。还有弗里德曼,科尔多瓦等等。

(3)内核级迁移:基于内核的实现可以充分利用OS提供的功能,全面获取进程和OS状态,因此实现效率高,可以为用户提供良好的透明性。但是由于需要修改OS,所以实现比较复杂。这个领域的典型系统是MOSIX和Sprite系统。

流程迁移的主要工作是提取流程状态,然后根据流程状态在目的节点重新生成流程。现实中,一个进程有很多状态,随着操作系统的演进,进程状态也越来越多样化。一般来说,一个流程的状态可以分为以下几类:①流程执行状态。表示当前运行进程的处理器状态,与机器高度相关。包括上下文切换时内核保存和恢复的信息,如通用和浮点寄存器值、堆栈指针、条件代码等。②过程控制。操作系统用来控制进程的所有消息一般包括进程优先级、进程标识、父进程标识等。一旦系统安排了过程控制信息,过程迁移系统必须冻结过程的运行。③进程的内存状态和进程地址空之间。包括进程的所有虚拟内存信息、进程数据和堆栈信息,是进程状态最重要的部分。④流程的消息状态。包括进程缓冲消息和链路控制信息。在流程迁移中维护通信连接和在迁移后恢复连接是流程迁移中一个具有挑战性的问题。⑤文件状态。进程的文件状态包括文件描述符和文件缓冲区。保持文件缓存一致性和进程间文件同步访问也是进程迁移机制的重要考虑因素。

差异

模拟集群和数字集群的区别在于,模拟集群在单通道上的用户容量比数字对讲机小,语音没有数字对讲机清晰,只能实现简单的数据功能。

数字集群分为时分多址和FDMA。时分多址是为专业用户提供的时分系统。FDMA提供民用,是一个频分系统。

与模拟对讲机相比,FDMA可以使信道间隔更窄(模拟为25千赫,数字为12.5千赫两个时隙或6.25千赫四个时隙),每个信道的用户数量更大,但对用户来说没有太多的更新体验。

与模拟对讲机相比,基于时分多址的对讲机在单通道中具有更大的用户容量,在现实中也可以在同一频率上传输。在模拟系统中,要实现传输,必须有一对接收和发射频率。在时分多址数字系统中,可以利用数字技术实现通过时隙转换的传输。比如转盘接收时隙A的数据,同时转发的数据在时隙B实现..

目前国内还没有自己的数字对讲机标准。目前摩托罗拉的数字对讲机是TDMA,ICOM和建武的数字对讲机是FDMA。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 集群技术是什么

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情