一、PVM并行程序向GAMMA迁移的方法(论文文献综述)
李婷[1](2014)在《一种平台无关的并行编程模型的设计与实现》文中研究说明并行计算机体系结构的发展,带来了并行计算机性能的快速提升和并行计算平台的多样化,同时也对研究和应用人员提出挑战:(1)如何降低并行编程难度,使不具有并行计算知识背景的用户能够快速有效的开发并行程序,充分发挥并行计算机在不同应用领域的计算能力;(2)如何使现有的大量串行程序以一种稳健可靠的、非颠覆式的方式并行化;(3)如何使并行编程不依赖于硬件平台,当底层计算平台发生变化时仍可以有效运行。目前,设计合理有效的并行编程模型是解决多种并行程序开发难题的主要手段。本文设计并实现了一种基于并行函数库的并行编程模型。编程模型的设计思路和方法为:(1)为简化并行编程,支持串行软件的非颠覆式并行化,以并行函数库的方式隐藏底层并行化细节,并提供与传统串行编程相似的编程接口。用户依照传统串行软件的开发逻辑,通过API调用即可开发并行程序。(2)为实现并行编程的平台无关性,将平台相关的并行函数库向上封装为统一的API接口,用户通过调用平台无关接口开发并行程序,程序可无修改地运行于多种计算平台。(3)为提高程序性能,提供任务调度和数据分配功能,使系统在处理较为复杂的多任务计算问题时,仍能达到较好的负载均衡和较低的并行开销。(4)在系统可扩展性方面,具备功能可扩展性和计算平台可扩展性。功能可扩展是指可扩展应用函数库和运行时函数库,可针对具体应用领域开发专业型编程模型;计算平台可扩展是指可以支持新的底层计算平台。本文利用矩阵乘法算法和频率统计算法设计了三组实验,分别验证编程模型的平台无关性,多任务调度系统的有效性,并测试了编程模型对程序性能的影响。实验表明该编程模型能够有效简化并行程序开发,基于该编程模型的程序可在多种计算平台上有效地编译运行;系统的任务调度功能能够提高多任务计算问题的总体性能;编程框架可能会造成一定的开销,但不影响程序的总体性能。本文在编程模型原型系统的基础上扩展和设计了面向遥感图像处理的并行编程模型。扩展的并行编程模型保留了原型系统的易用性和平台无关性,扩展了适合遥感数据特点的数据结构,增加了地理空间数据格式支持库,并且根据遥感图像处理算法的特点对函数库做分层设计,最大限度地减少代码冗余。通过在扩展的并行编程模型上进行遥感图像非监督分类的实验,验证了该编程模型的有效性。
丁锐[2](2013)在《面向分布存储结构的数据分布及代码生成技术研究》文中进行了进一步梳理当今世界上主流的高性能计算机系统大多提供了丰富的并行机制,其中分布存储结构、共享存储结构及SIMD短向量功能部件等可支持不同级别的并行程序运行,如何在并行化编译系统中自动发掘应用程序中蕴含的不同层次、不同粒度的并行性已成为提高高性能计算机系统应用性能的一项关键技术。在分布存储结构下,每个计算节点都拥有着独立的存储空间,节点之间需要明确的消息传递完成数据的交换。这意味着,面向分布存储的并行化编译需要准确给出程序中的计算划分与数据分布,使得并行计算中各计算节点尽量引用本地数据,以获得最大的数据局部性和并行性。而由于计算节点访问本地存储器的速度远远快于通过网络访问异地存储器的速度,所以通信代码的效率直接影响到程序的并行性能。为此面向分布存储的并行化编译还需要生成正确、高效通信代码来维护数据的一致性。本文以并行化编译器SW-VEC的研发为背景,系统深入地探讨了面向分布存储并行化编译中数据分布和代码生成的若干问题,研究的主要内容和贡献包括:1、面向数据分布的数组数据流分析。传统数组数据流分析方法主要针对精确依赖测试、数组私有化等问题进行研究,无法为数据分布算法提供数组在循环间详细的定义-引用信息,从而影响了数据分布方案的优化选择。针对该问题提出了面向数据分布的数组数据流分析算法,通过引入定义-引用图描述数组元素在循环间的数据流向,为实施数据分布算法中优化方案的选择提供了详细的数据流信息。测试结果表明所提出的算法,能够有效提高数据分布算法的并行收益评估精度,减少生成代码中的通信冗余;2、面向分布存储的仿射分解。现有的仿射分解为了兼顾共享存储和分布存储两种结构的并行,存在划分约束过紧的问题,限制了自动并行化过程中对存在反依赖和输出依赖代码的并行性挖掘。针对该问题,本文通过分布存储结构下内存私有的特点建立划分约束条件,以此对仿射分解进行了改进,消除了其在分布存储结构下反依赖和输出依赖的冗余约束限制,提升了并行化编译对并行性的挖掘能力;3、数据分解中的数组生命期。现有的数据分布研究未考虑数组生命期对数据分解结果的影响问题,导致数据分解在数组的不同生命期中不一致时会产生冗余通信,还会影响代价评估模型对并行收益的判断,减少数据分解的选择。为解决上述问题,提出了一种基于数组生命期的数据分解算法,使用分解映射表为数组不同的生命期建立各自的数据分解版本,消除了数据分解在不同生命期之间的无效关联,有效减少了分解中数据重分布的次数以及由重分布产生的通信开销;4、基于主导值的数据分解优化。数据迁移代价最昂贵数组的分布好坏直接决定了数据分解结果的优劣。提出了基于主导值的数据分解优化算法,将数组可能引起的通信代价量化为主导值以指导分解的先后次序,优先为主导值大的数组寻找数据分布方案,并通过推后其它数组的划分以减少其对主导数组分布的约束,有效降低了主导数组重分布所产生的大量冗余通信;5、精确通信代码的生成与优化。传统的代码生成研究主要通过将每个需要重映射的数据都同步到所有处理器来完成通信,会带来大量随着处理器数目的增长而递增的通信冗余。针对该问题,提出了一种精确的通信代码生成算法,按照数组重分布前后的数据分解对局部数据空间的划分来求解每个数据重映射的源处理器和目的处理器,以产生精确的通信代码。实验结果表明,该算法能够有效消除数组重分布的通信冗余,提升自动生成并行程序的执行性能。6、不规则问题的数据分布和代码生成。许多大规模计算程序包含了不规则循环,但在面向分布存储的自动并行化中,以往的研究较难在编译时划分不规则问题的数据,无法生成有效的通信代码。针对一类包含仿射可并行循环层的不规则问题提出了一种数据分布和代码生成方法,通过仿射计算分解和数组引用的访问表达式来分配不规则数组访问的数据到各处理器,并通过冗余复制技术来满足不规则数组的生产者-消费者关系,生成有效的计算和通信代码。实验结果验证了该方法的有效性,并对测试用例取得了预期的加速比。本文提出的优化技术已在课题组研制的SW-VEC系统中得到了实现和应用,验证了以上算法的正确性和有效性。
卢风顺[3](2012)在《面向CPU/GPU异构体系结构的并行计算关键技术研究》文中研究指明由于半导体工艺、制造工艺、功耗等各种因素的共同影响,处理器体系结构呈多样化发展趋势,致使高性能计算领域出现了多种并行计算机体系结构。在绿色高性能计算时代,CPU/GPU异构高性能计算系统可以兼顾通用性、性能和效能,是一种非常有发展前景的并行计算机类型。大型CPU/GPU异构系统强大的计算能力为大规模科学和工程计算提供了很好的机遇,然而其复杂的硬件结构和独特的程序执行特点又给众多高性能计算研究人员提出了巨大的难题。并行计算研究涉及的内容非常广泛,本文仅关注并行计算模型、并行编程模型和并行可扩展性模型三个方面。并行计算模型是对底层并行计算机系统的抽象,用少量参数反映该系统的资源和性能特征,为并行算法设计者搭建起软件和硬件之间的桥梁。并行编程模型是一种程序抽象的集合,为并行程序设计者提供一幅透明的计算机软件/硬件系统简图。并行可扩展性模型则描述并行系统随系统/问题规模变化时的可扩展能力。对于新兴的CPU/GPU异构高性能计算系统,现有相关模型已无法准确描述其结构特点和性能影响因素,因此迫切需要针对该类高性能计算系统开展并行计算研究,从而为当前以及未来基于该类平台的并行应用开发提供支持。针对大规模CPU/GPU异构高性能计算系统,本文围绕并行计算模型、并行编程模型和并行可扩展性模型等并行计算关键技术展开深入的分析和研究。论文的工作主要集中在以下五个方面:(1)全面系统地综述了三个并行计算关键技术的相关工作。在深入分析并行计算机体系结构特点及其发展趋势的基础上,系统概括了国内外有关并行计算模型、并行编程模型和并行可扩展性模型的研究进展,给出各种模型的若干典型实例并对其进行了对比分析。(2)提出了面向大型CPU/GPU异构高性能计算系统的并行计算模型HLognGPM。该模型能够有效描述CPU/GPU异构系统的计算能力和各种通信行为,包含延迟、开销、消息间隔、原子通信数目、每字节间隔和处理器性能六个参数,其中决定模型的复杂度和精确度。在分析HLognGPM模型复杂度的基础上,将其简化版HLog3GPM映射到TH-1A系统上,并测定出平台相关的所有模型参数。借助NPB-EP和NPB-CG测试程序,对比分析了五种并行计算模型的性能,发现HLog3GPM模型具有最高的预测精度。(3)针对大型CPU/GPU异构高性能计算系统构建出并行编程模型MPI+OpenMP/CUDA。与常用的MPI+CUDA模型相比,该模型可充分开发CPU/GPU异构系统所包含的巨大计算能力。该模型通过MPI实现节点间的消息传递操作,分别利用OpenMP和CUDA开发节点内多核CPU和众核GPU的计算能力。两种混合编程模型的对比实验表明,本文提出的混合模型具有较大的性能优势,尤其适合易并行类应用。(4)提出协同感知并行可扩展性模型来描述并行算法—GPU集群组合的可扩展性。在并行算法—GPU集群组合扩展过程中,该模型确保计算/协同开销比保持不变,研究系统规模、问题规模和协同开销对该组合可扩展性的影响。大量数值实验表明,该模型能较好地描述并行算法—GPU集群组合的并行可扩展性。另外,该模型可帮助并行应用开发人员发现更好的并行算法—GPU集群组合方式,以及通过小规模组合的性能来预测更大规模时的性能。(5)将长波辐射方案程序移植到大型CPU/GPU异构高性能计算系统上,为领域科学家加速历史遗留代码提供了一定的借鉴经验。在基本保持长波辐射传输过程模拟计算精度的前提下,GPU加速计算可显着提升其计算效率。另外,数值实验还表明RRTM异构混合程序具有较好的强可扩展性和协同感知可扩展性。
李娜[4](2009)在《基于MPI的并行数据库中间件的设计与实现》文中研究表明随着全球信息化浪潮和计算机应用领域的不断拓展,各行各业需要处理的信息量越来越大,尤其在航空航天、通信、海洋开发、天气预报、军事等诸多领域,数据规模己达到TB级甚至PB级,传统的串行数据库系统面对如此庞大的数据处理已显得力不从心。因此,设计并行数据库系统用来存储和管理大规模数据,提供比传统数据库系统更好的性能已经成为数据库领域的共识。并行数据库系统是以高性能、高可用性和高扩充性为目标,充分利用多处理器平台的工作能力,多个处理机协同处理,以达到更快的数据库响应速度和分析能力。目前已经有了一些相对成熟的并行数据库技术,同时也存在一些商业化的并行数据库产品。本文结合前人的研究成果,在无共享(SN)结构的集群(Cluster)系统上,提出了基于MPI结合已有关系型DBMS进行并行数据库系统中间件软件的开发,该中间件的设计目的就是为了屏蔽并行程序和数据库的操作,直接向上层用户提供并行数据库操作。在这个思路的指导下设计研究出了一个并行数据库原型系统PDBS-0。本文的主要研究成果如下:1、在集群的基础上建立了一整套软件硬件的研究平台。2、提出了基于MPI和Access的并行数据库系统中间件软件PDBS-0的理论框架。3、实现了很多并行数据库查询操作模块。如并行排序、并行选择、并行连接。4、对整个系统在平台下进行全面的测试并进行了详细的测试结果分析,总结出了提高整个系统性能的关键点。
于策[5](2009)在《EasyPAB:面向并行应用的辅助开发平台》文中指出随着多核处理器以及集群(高性能计算集群/高可用集群)系统在各应用领域的普及,并行计算将无处不在。并行程序设计将成为软件工程过程的必要环节,并行应用程序建模与编程将是开发者的必备技能。针对并行计算的普及为软件工程方法所提出的挑战,提出一种业务逻辑与可并行化计算相分离的软件工程方法(PCO:Parallel Computing Offload),基于传统的软件系统分析与设计过程,将业务逻辑中需要且能够并行化的部分分离为独立模块,根据具体并行计算运行环境和并行程序设计语言进行设计与封装,使得设计实现的软件系统能够适应多种类型的并行计算环境。论证了PCO方法的必要性、可行性及实现途径,规定了具体的实施原则,并提出相应的软件体系结构层次参考模型。为辅助设计开发面向不同并行计算环境的应用程序,提出了名为EasyPAB的可扩展并行应用程序辅助开发平台,用于支持PCO软件工程方法中并行计算模块设计。EasyPAB融合了并行程序设计模式、并行结构骨架等原理、方法与技术以简化并行应用的设计与开发,提供统一的用户界面,并根据具体运行期环境自动生成源代码框架,支持消息传递和共享内存编程模型。ParaModel是EasyPAB中的可视化建模系统,定义了一套用于描述并行应用与算法的图形语言符号集,以及相应的基本建模规则与逻辑验证机制,支持开发者在可视化建模环境中使用图形符号描述应用程序或算法。EasyPAB根据开发者所指定的运行期环境将模型解析为源代码框架,为开发者生成与并行计算相关的细节。EasyPAB支持基于设计模式的复用。面向一类实时服务应用提出了主动任务迁移模式(ATM,Active Task Migration pattern),采用多服务器集群的方式提供实时服务,根据服务器中关键资源的消耗情形主动触发任务的迁移和服务器资源的恢复,并设计了相应的任务迁移模型和策略以避免多个服务器同时停止服务。在基于Java的SIP服务器集群中实现了主动任务迁移模式,实际测试结果表明本模式能够有效避免Java虚拟机进行垃圾收集所引发的服务停顿。EasyPAB的系统实现基于Eclipse的插件式体系结构,支持第三方扩展。建模系统ParaModel的实现基于GEF技术。通过实例展示了建模的过程。
黄永忠[6](2007)在《移动代理计算模型及其在分布并行计算中的应用研究》文中研究表明本文以移动代理技术在分布并行中的可行性与有效性为研究目标,提出了一种基于移动代理面向大规模分布并行的主动计算模型。由于移动代理的自治性、反应性、可移动性等多种特性使得它适合在动态、异构的网络环境下进行分布并行计算。本文在分析介绍移动代理技术应用于分布并行计算相关的技术和应用研究现状的基础上,提出了系统的整体架构和基于Π演算的描述模型。将移动代理技术应用于分布并行计算,必须综合考虑性能和可编程性两个方面的问题。本文提出并实现了一种面向高性能计算的轻量级代理移动模型。该模型基于模块化的思想,通过策略分布、策略组装等方式实现产生式重构迁移,从而大大提高了代理的活动效率。本文提出并实现了一种多层次分布元组空间模型,保证了代理间协同的高效性和灵活性,并使得系统具有很好的可扩展性,能满足大规模分布并行计算的要求。本文提出了一种异步的、基于元组空间、支持移动的组通信模型。该模型不仅在组成员的加入、撤出或崩溃情况下可以保证虚拟同步,在计算移动存在的情况下也同样能够保证。此外该服务提供异步广播通信机制。由组服务中间件保证广播消息的虚拟同步,之后再写入应用程序的元组空间,至于广播消息是否使用、何时使用则由应用程序负责,保证了应用开发的灵活性。针对某领域几类典型问题,论文利用提出的模型进行了实验,结果验证了基于移动代理的分布并行计算的可行性与有效性。在模型描述方面,由于Π演算具有简洁性和较强的表达力,适合描述移动计算。本文在标准Π演算的基础上扩充了网、位置等概念以及代理迁移、组通信、元组空间读写等操作前缀,给出了相关钩模拟与互模拟的定义,并对一些基本性质进行了分析。
孙宇[7](2007)在《ProActive环境下并行程序容错调度的研究》文中研究表明随着大规模分布式并行应用的兴起,越来越多的计算机加入其中,极大的提高了系统的计算能力。而另一方面,计算机自身的不稳定性,给系统带来了许多隐患,降低了系统的可靠性。恶意的计算节点以及第三方节点的攻击,对系统的安全构成了很大的威胁。计算的正确性和安全性已经成为大规模分布式并行计算所关心的首要问题之一。ProActive是一个由法国的INRIA开发的分布式并行计算的纯Java类库,ProActive提供了大量的技术来简便网格和网络环境下应用的开发。本文在ProActive环境下,针对分布式并行计算的安全问题和容错问题,对容错技术、信任度技术、容错调度模型、信任管理模型、容错调度算法、子任务备份等技术进行研究。利用上述方法提出了一个引入信任度的容错调度模型的设计方案,改进了原有的并行计算平台WPHPC,并在改进后的平台上进行了实验。实验表明,引入信任度的容错调度模型在不增加额外资源的前提下,提高了系统的可靠性和安全性。本文的主要的工作:①在原有的并行计算平台的基础上,设计了容错任务的调度模型及三种容错调度算法,并且对容错调度算法下矩阵相乘计算模型的进行了实验分析比较,结果表明:在系统不增加额外资源的前提下,容错调度模型在计算节点失效的情况下依然保证了计算的正确性,提高系统的可靠性。②在原有容错调度模型的基础引入信任度机制,并提出了一种新的基于信任度的容错调度模型。再对矩阵相乘计算模型进行了实验分析比较,表明基于信任度的容错调度模型提高了系统中高信任度计算节点的利用率,提高了系统的安全性和健壮性。③在之前这设计的容错调度模型的基础上,改进了原有的并行计算系统,设计和实现了一个具有容错功能的系统的原型。
倪安宁[8](2007)在《并行交通仿真模型及关键算法研究》文中进行了进一步梳理基于并行计算理论中以空间换取时间的思想,采用多个处理器来实现并行仿真,为有效提高微观交通仿真的速度及效率提供了可行途径。本文首先在分析将并行计算技术应用于交通仿真的必要性及可行性基础上,将多台价格相对便宜的PC机通过局域网连接搭建了并行计算集群平台,建立了基于空间域分解的并行微观交通仿真模型,将大规模路网交通仿真计算任务分散到各节点机,以并行的方式协作完成整个仿真过程。接着,深入研究了分布式并行交通仿真实现中的各种关键算法:实现了正交递归对分法及多级分割法的路网分割算法;将离散事件仿真中的基于保守时间窗的同步策略应用到并行微观交通仿真中;设计了基于局部算法的动态负载平衡机制。采用PVM及CPPVM消息传递库及主-从式并行计算模型开发了基于LINUX集群平台的交通并行仿真系统TPSS(Traffic Parallel Simulation System)。然后,通过长春市实际道路交通调查与仿真结果的对比分析,验证了TPSS系统的有效性。此外,通过大规模格状交通网络上的实验测试结果可以看出,TPSS可以获得较好的并行仿真加速比,从而提高大规模路网中的微观交通仿真速度。最后,将TPSS系统应用到长春市大经路-五马路交叉口的交通改造中,并给出了合理的改造建议。
姚成浪[9](2007)在《基于MPI的集群计算系统设计与实现》文中研究表明科学技术的发展极大地促进了计算科学的进步。新一代计算机无论是计算能力还是计算速度都比以前的计算机优越,但是人类对计算的要求也在不断地提高。在实践中,有些单处理器不能很好地满足某些工程计算的需求,所以除了增加处理器本身的计算性能外,并行计算是一种提高计算能力的有效方法。计算机集群就为这样的并行计算提供了很好的平台。计算机集群系统就是将多台计算机组合起来进行协同工作,提供强大的并行计算能力的集群计算系统,它利用现有的计算机资源,把繁重的任务分配到各个计算节点上进行处理。本文首先详细研究了Linux集群的体系结构与功能,分析了现有的集群研究状况和并行计算编程模型,以及单一系统映像和集群中间件。通过引入集群中间件,设计了一个新型的集群并行系统。通过实现集群中间件中的各功能模块,使该系统具有网络负载测试功能、反映各节点负载动态变化的功能以及根据节点负载合理地分配任务的功能。这些研究和实现是当前集群并行系统研究的热点,为相关研究提供一些借鉴。最后,基于本集群系统设计了两个并行应用程序,分别采用静态分配算法和动态加权轮转分配算法。然后使用客户程序对该集群系统进行了外部性能测试,并且对测试结果进行了分析。实验表明,该集群系统具有良好的计算性能和快速的外部响应性能。
董明刚[10](2006)在《基于ProActive的并行计算技术研究》文中研究表明高性能计算技术是一个国家竞争力和科研实力的重要标志之一,并行计算技术受到各国的广泛重视。科学与工程计算中的很多问题的求解都依赖于并行计算技术。但目前的并行计算技术大多是基于MPI/PVM的,它们存在的主要问题是对异构环境的支持不好,程序可移植性差,不便于扩展,配置复杂等[1,2]。 ProActive是一个由法国的INRIA开发的并行分布式计算的纯Java中间件,使用ProActive能方便地开发网格和网络环境下的应用[3]。在对ProActive中间件进行深入研究的基础上,提出了基于ProActive的并行计算平台的设计方案,对所涉及的到的并行计算平台的结构;节点的部署;并行程序设计;任务的调度等关键技术进行了研究,并给出了具体的实现技术。利用上述方法实现了一个原型系统:PHPC(ProActive-based High Performance Computing for Windows),并进行了实验,实验表明该方案很好的克服了现有技术的不足,具有支持异构,可移植性好,易于扩展,配置简单等特点。为基于ProActive的并行计算平台的研究提供了理论与技术的上支持。 本文所做的主要工作如下: 1.对ProActive软件包进行了较深入的研究。 2.对基于ProActive并行计算平台的体系结构进行了研究,根据ProActive的特点,提出一个六层的并行计算平台方案,并针对平台开发中的结点的动态部署和服务的发布等平台实现中的关键技术的给出了具体的解决方法: 3.对基于ProActive并行程序设计技术做详细的介绍,为该计算平台设计了编程接口,开发出了可在此平台下运行的三个具体并行应用:PI、TSP、Matrix; 4.对平台中任务调度问题进行了深入的研究,结合ProActive的特点设计并实现了可按池算法、静态算法和动态算法进行任务调度的调度器,实验证明该调度器是可行的和有效的; 5.实现了一个原型系统PHPC,利用开发的实例,在平台上进行了实验,给出详细的实验数据并对结果进行了分析,结果表明本文提出的方案切实可行,具有一定的研究与应用价值。
二、PVM并行程序向GAMMA迁移的方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、PVM并行程序向GAMMA迁移的方法(论文提纲范文)
(1)一种平台无关的并行编程模型的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
表格 |
插图 |
第一章 绪论 |
1.1 研究背景 |
1.1.1 并行计算的发展 |
1.1.2 并行程序设计面临的挑战 |
1.2 并行编程模型的概念和研究现状 |
1.2.1 并行编程模型的概念 |
1.2.2 主流并行编程模型介绍 |
1.2.3 并行编程模型的研究现状 |
1.3 本文研究内容 |
1.3.1 平台无关的并行编程模型设计 |
1.3.2 并行编程模型在遥感图像处理中的应用 |
1.4 论文组织结构 |
第二章 相关并行编程模型介绍 |
2.1 OpenMP并行编程模型 |
2.1.1 共享变量并行模型 |
2.1.2 OpenMP编程模型 |
2.1.3 OpenMP程序结构 |
2.2 MPI并行编程模型 |
2.2.1 消息传递模型 |
2.2.2 MPI概述 |
2.2.3 MPI程序结构 |
2.3 CUDA并行编程模型 |
2.3.1 CUDA编程模型 |
2.3.2 CUDA硬件架构 |
2.3.3 CUDA程序结构 |
2.4 本章小结 |
第三章 跨平台并行编程模型的设计与实现 |
3.1 背景分析 |
3.1.1 传统并行编程模型的局限性 |
3.1.2 基于并行函数库的编程模型 |
3.2 设计原则 |
3.3 并行编程模型设计与实现 |
3.3.1 编程模型的系统结构 |
3.3.2 编程模型的运行时库 |
3.3.3 编程模型的数据结构 |
3.3.4 混合编程支持 |
3.4 运行时调度系统 |
3.4.1 任务调度 |
3.4.2 数据调度 |
3.4.3 小结 |
3.5 实验验证 |
3.5.1 平台无关性实验验证 |
3.5.2 任务调度系统实验验证 |
3.5.3 系统性能测试 |
3.6 本章小结 |
第四章 并行编程模型在遥感图像处理中的应用 |
4.1 研究背景 |
4.1.1 遥感图像处理的并行化趋势 |
4.1.2 遥感图像处理并行编程的研究现状 |
4.2 并行编程模型的扩展设计 |
4.2.1 编程模型的应用优势与扩展思路 |
4.2.2 并行函数库的扩展设计 |
4.2.3 其他扩展 |
4.3 实验验证 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 存在问题与展望 |
参考文献 |
致谢 |
在读期间参加的科研项目 |
在读期间发表的学术论文与取得的研究成果 |
(2)面向分布存储结构的数据分布及代码生成技术研究(论文提纲范文)
摘要 |
Abstract |
目录 |
图录 |
表录 |
第一章 绪论 |
1.1 课题研究背景 |
1.2 并行编译技术的发展 |
1.2.1 体系结构 |
1.2.2 面向向量机的向量化编译 |
1.2.3 面向共享存储结构的并行化编译 |
1.2.4 面向分布存储结构的并行化编译 |
1.2.5 面向 SIMD 扩展的向量化编译 |
1.3 课题来源 |
1.4 SW-VEC 并行化编译系统 |
1.4.1 Open64 及其中间表示 |
1.4.2 消息传递模型和 MPI |
1.4.3 面向分布存储的 MPI 并行化编译 |
1.5 研究内容 |
1.6 组织结构 |
第二章 数组数据流分析 |
2.1 研究动机 |
2.2 问题描述 |
2.3 数组数据流分析 |
2.3.1 定义-引用图 |
2.3.2 局部数据流分析 |
2.3.3 全局数据流分析 |
2.3.4 过程间数据流分析 |
2.4 实验与分析 |
2.5 相关研究 |
2.6 小结 |
第三章 面向分布存储的计算和数据分解 |
3.1 研究动机 |
3.2 基础知识 |
3.2.1 线性不等式系统 |
3.2.2 仿射分解 |
3.2.3 两级映射模型 |
3.3 面向分布存储的划分约束 |
3.3.1 反依赖和输出依赖 |
3.3.2 问题描述 |
3.3.3 单嵌套循环的划分约束 |
3.4 实验与分析 |
3.5 小结 |
第四章 基于数组生命期的数据分解算法 |
4.1 研究动机 |
4.2 问题描述 |
4.3 数据分解映射表 |
4.3.1 数组的生命期 |
4.3.2 生命期未重叠 |
4.3.3 生命期重叠 |
4.4 基于生命期的数据分解算法 |
4.4.1 分解核空间的计算 |
4.4.2 开销评估 |
4.4.3 寻找计算和数据分解 |
4.5 分解实例 |
4.5.1 建立定义-引用图 |
4.5.2 建立数据分解映射表 |
4.5.3 数据分解算法 |
4.6 实验与分析 |
4.6.1 矩阵运算和 ADI 方法 |
4.6.2 NPB 测试 |
4.7 相关研究 |
4.8 小结 |
第五章 基于主导值的数据分解优化 |
5.1 研究动机 |
5.2 问题描述 |
5.3 主导值的计算 |
5.4 数据分解优化算法 |
5.4.1 算法描述 |
5.4.2 分解示例 |
5.5 实验与分析 |
5.6 相关研究 |
5.7 小结 |
第六章 精确通信代码的生成与优化 |
6.1 研究动机 |
6.2 基本概念 |
6.2.1 物理映射 |
6.2.2 符号系数不等式系统 |
6.2.3 扫描多面体生成嵌套循环 |
6.3 数据重组通信 |
6.3.1 打包代码生成 |
6.3.2 解包代码生成 |
6.4 近邻通信 |
6.5 实验与分析 |
6.6 相关研究 |
6.7 小结 |
第七章 一类不规则问题的数据分布与代码生成 |
7.1 研究动机 |
7.2 问题描述 |
7.3 数据分布算法 |
7.4 代码生成算法 |
7.4.1 冗余复制通信 |
7.4.2 算法描述 |
7.5 实验与分析 |
7.6 相关研究 |
7.7 小结 |
第八章 结论 |
8.1 全文工作总结 |
8.2 下一步工作 |
致谢 |
参考文献 |
作者简历 |
(3)面向CPU/GPU异构体系结构的并行计算关键技术研究(论文提纲范文)
目录 |
表目录 |
图目录 |
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.1.1 CPU/GPU 异构高性能计算系统 |
1.1.2 GPU 高性能计算应用 |
1.1.3 并行计算研究面临的挑战 |
1.2 主要研究内容和贡献 |
1.3 论文结构 |
第二章 并行计算关键技术研究综述 |
2.1 并行计算机体系结构 |
2.1.1 Flynn 分类法 |
2.1.2 并行计算机体系结构模型 |
2.1.3 并行计算机体系结构的发展趋势 |
2.2 并行计算模型 |
2.2.1 PRAM 类模型 |
2.2.2 BSP 类模型 |
2.2.3 LogP 类模型 |
2.2.4 异构并行计算模型 |
2.3 并行编程模型 |
2.3.1 数据并行模型 |
2.3.2 消息传递模型 |
2.3.3 共享变量模型 |
2.3.4 一些新兴编程模型 |
2.4 并行可扩展性模型 |
2.4.1 加速比模型 |
2.4.2 可扩展性度量指标 |
2.5 本章小结 |
第三章 HLognGPM:面向 GPU 集群的并行计算模型 |
3.1 引言 |
3.2 相关工作 |
3.3 HLognGPM 通用并行计算模型 |
3.3.1 模型定义 |
3.3.2 模型应用 |
3.4 HLog3GPM 并行计算模型 |
3.4.1 参数测定方法 |
3.4.2 映射到 TH-1A 系统 |
3.5 模型的验证 |
3.5.1 实验方案 |
3.5.2 测试案例 NPB-EP |
3.5.3 测试案例 NPB-CG |
3.6 讨论 |
3.7 本章小结 |
第四章 几种混合编程模型在 GPU 集群上的性能比较 |
4.1 引言 |
4.2 相关工作 |
4.2.1 编程模型 |
4.2.2 NPB 基准测试程序集 |
4.3 大型 GPU 集群的混合编程模型 |
4.3.1 MPI+CUDA(MC)混合编程模型 |
4.3.2 MPI+OpenMP/CUDA(MOC)混合编程模型 |
4.4 NPB 内核的高效混合实现 |
4.4.1 EP 程序的混合实现 |
4.4.2 CG 程序的混合实现 |
4.4.3 MG 程序的混合实现 |
4.5 混合模型的性能对比 |
4.5.1 性能评价准则 |
4.5.2 实验设计 |
4.5.3 性能分析 |
4.5.4 讨论 |
4.6 本章小结 |
第五章 并行算法—GPU 集群组合的可扩展性研究 |
5.1 引言 |
5.2 相关工作 |
5.3 协同感知可扩展性模型 |
5.3.1 GPU 集群体系结构模型 |
5.3.2 模型的定义 |
5.3.3 可扩展性分析 |
5.3.4 可扩展模型使用方法 |
5.4 实验验证 |
5.4.1 实验设计 |
5.4.2 EP-GC组合的可扩展性分析 |
5.4.3 CG-GC组合的可扩展性分析 |
5.4.4 MG-GC组合的可扩展性分析 |
5.5 本章小结 |
第六章 RRTM 长波辐射方案在 GPU 集群上的高效实现 |
6.1 引言 |
6.2 长波辐射物理过程 |
6.2.1 长波辐射过程 |
6.2.2 RRTM 长波辐射传输方案 |
6.3 异构混合并行算法设计 |
6.3.1 RRTM 程序执行特点 |
6.3.2 并行策略 |
6.3.3 负载平衡策略 |
6.3.4 异构混合并行算法 |
6.4 高效混合实现 |
6.4.1 GPU 程序优化 |
6.4.2 MOC 混合实现 |
6.5 数值实验及可扩展性分析 |
6.5.1 负载平衡策略的验证 |
6.5.2 RRTM 混合程序的计算效率 |
6.5.3 可扩展性分析 |
6.6 本章小结 |
第七章 结论与展望 |
7.1 工作总结 |
7.2 研究展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
作者在学期间参加的科研项目 |
(4)基于MPI的并行数据库中间件的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 背景 |
1.2 并行数据库研究的必要性 |
1.2.1 数据库应用的新特点 |
1.2.2 关系数据库系统的固有并行性 |
1.3 国内外研究现状 |
1.4 并行数据库研究的问题 |
1.5 课题提出依据及目标 |
1.6 本章小结 |
第二章 研究实验平台的搭建 |
2.1 并行数据库系统简介 |
2.1.1 并行数据库的实现目标 |
2.1.2 并行数据库的系统结构 |
2.1.3 并行数据库与分布式数据库的区别 |
2.1.4 并行数据库系统的结构选择 |
2.2 PC集群系统简介 |
2.2.1 集群系统的特点和分类 |
2.2.2 集群系统构建 |
2.3 并行数据库实验软件的选择 |
2.3.1 操作系统的选择 |
2.3.2 并行开发库的选择 |
2.3.3 局部RDBMS的选择 |
2.4 小结 |
第三章 系统软件的设计 |
3.1 系统实现模型策略 |
3.2 系统软件结构整体设计 |
3.3 重要模块的研究与实现 |
3.3.1 数据的划分 |
3.3.1.1 数据的划分方式 |
3.3.1.2 数据划分的设计与实现 |
3.3.2 并行选择 |
3.3.3 并行排序 |
3.3.3.1 并行排序算法 |
3.3.3.2 并行排序模块的研究与实现 |
3.3.4 并行连接 |
3.3.4.1 串行连接算法 |
3.3.4.2 并行连接算法 |
3.3.4.3 并行连接模块的设计 |
3.4 本章小结 |
第四章 实验结果分析 |
4.1 实验测试平台 |
4.2 实验测试结果及分析 |
4.3 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间取得的科研成果 |
致谢 |
(5)EasyPAB:面向并行应用的辅助开发平台(论文提纲范文)
中文摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.3 论文主要工作及组织结构 |
第二章 相关工作介绍 |
2.1 并行计算硬件平台 |
2.2 并行程序设计语言 |
2.3 并行程序设计模式及复用技术 |
2.4 并行程序设计方法学和开发工具 |
2.5 本章小结 |
第三章 逻辑与计算分离的软件工程方法 |
3.1 问题定义与软件工程方法 |
3.2 业务逻辑与可并行化计算的分离 |
3.2.1 分离途径与方法 |
3.2.2 分离原则 |
3.3 PCO软件体系结构层次参考模型 |
3.4 本章小结 |
第四章 EasyPAB体系结构 |
4.1 功能目标 |
4.2 逻辑体系结构 |
4.3 模式复用机制 |
4.3.1 并行程序设计模式库 |
4.3.2 并行结构骨架库 |
4.4 可视化建模系统 |
4.4.1 ParaModel架构 |
4.4.2 建模图形符号 |
4.4.3 建模规则定义与模型验证 |
4.5 源代码框架的生成 |
4.6 本章小结 |
第五章 主动任务迁移模式及调度策略 |
5.1 模式概述 |
5.2 模式在EasyPAB中的模型描述 |
5.3 调度模型和算法 |
5.3.1 调度模型与算法 |
5.3.2 算法证明 |
5.4 模式应用 |
5.5 本章小结 |
第六章 EasyPAB系统实现与建模示例 |
6.1 EasyPAB系统实现 |
6.2 并行应用程序建模示例 |
6.2.1 基于MPI的Fork/Join模式 |
6.2.2 Jacobi迭代法解线性方程组 |
6.3 本章小结 |
第七章 结论与展望 |
参考文献 |
发表论文和科研情况说明 |
致谢 |
(6)移动代理计算模型及其在分布并行计算中的应用研究(论文提纲范文)
目录 |
表目录 |
图目录 |
摘要 |
ABSTRACT |
第1章 引言 |
1.1 移动代理计算范型 |
1.2 移动代理与分布并行计算 |
1.3 研究目标与研究内容 |
1.4 论文组织与主要贡献 |
第2章 相关理论与技术研究 |
2.1 Π演算及其进展 |
2.1.1 移动代理理论模型 |
2.1.2 π演算及其发展 |
2.1.3 讨论 |
2.2 计算迁移技术 |
2.2.1 讨论 |
2.3 基于移动代理的分布并行计算 |
2.3.1 PACMAN |
2.3.2 Traveler |
2.3.3 MESSENGER |
2.3.4 讨论 |
2.4 组通信研究 |
2.5 分布式系统中的协同模型 |
2.5.1 计算范型的演化 |
2.5.2 协同模型 |
2.5.3 协同模型与语言 |
2.5.4 讨论 |
2.6 小结 |
第3章 系统结构与基本模型 |
3.1 设计考虑 |
3.2 系统总体结构 |
3.2.1 运行平台 |
3.2.2 策略仓库 |
3.2.3 元组空间 |
3.2.4 目录服务和资源管理 |
3.3 基本模型 |
3.3.1 语法介绍 |
3.3.2 自由名集与约束名集 |
3.4 同构关系与规约关系 |
3.4.1 同构关系 |
3.4.2 规约关系 |
3.5 互模拟等价(BISIMULATION EQUIVALENCE) |
3.5.1 背景 |
3.5.2 标号转移语义 |
3.5.3 互模拟 |
3.6 小结 |
第4章 轻量级移动代理模型 |
4.1 概述 |
4.2 代理模型与结构 |
4.2.1 基本模型 |
4.2.2 策略与策略库的设计 |
4.2.3 代理的生命周期 |
4.2.4 代理间通信 |
4.2.5 XML描述 |
4.3 轻量级代理迁移 |
4.3.1 产生式重构迁移设计思想 |
4.3.2 AgentFactory |
4.3.3 迁移过程 |
4.4 移动语义的形式化描述 |
4.4.1 基本思想 |
4.4.2 语法描述 |
4.4.3 规约语义 |
4.4.4 钩模拟关系 |
4.4.5 标号转移与互模拟等价 |
4.5 小结 |
第5章 分布多层次元组空间协同模型 |
5.1 基于集中式LINDA模型的分布并行程序设计 |
5.1.1 Linda对分布并行程序设计的支持 |
5.1.2 实例分析 |
5.2 分布式元组空间 |
5.2.1 全分布与部分分布 |
5.2.2 位置感知与位置透明 |
5.2.3 混合式元组空间 |
5.2.4 多层次分布元组空间 |
5.3 分布式元组空间п演算模型 |
5.3.1 Linda模型 |
5.3.2 规约语义 |
5.3.3 钩子与钩互模拟 |
5.3.4 标号转移与互模拟等价 |
5.3.5 到标准π演算的翻译 |
5.4 小结 |
第6章 支持移动的组通信 |
6.1 支持移动的组服务结构设计 |
6.1.1 组成员服务和组通信服务 |
6.1.2 支持移动的组服务结构设计 |
6.2 组服务算法 |
6.2.1 加入组 |
6.2.2 离开组 |
6.2.3 进程移动 |
6.2.4 视图更新 |
6.2.5 协调者(coordinator) |
6.2.6 消息稳定传输 |
6.2.7 讨论 |
6.3 组通信Π演算 |
6.3.1 广播π演算 |
6.3.2 语法介绍 |
6.3.3 钩互模拟(barbed bisimulation) |
6.3.3.1 规约语义 |
6.3.3.2 钩子与钩模拟关系 |
6.3.4 标签转换语义与组互模拟 |
6.4 小结 |
第7章 基于移动计算的分布式并行程序设计模型及范例 |
7.1 程序设计模型 |
7.1.1 基于移动与协同、支持组通信的程序设计模型 |
7.1.2 应用模型 |
7.2 串匹配问题 |
7.3 CHOLESKY分布并行分解 |
7.3.1 Cholesky分解 |
7.3.2 矩阵cholesky分解的串行算法 |
7.3.3 矩阵cholesky分解的并行算法 |
7.3.4 基于计算移动的Cholesky分解 |
7.3.5 对比分析 |
7.4 小结 |
结束语 |
参考文献 |
作者简历 攻读博士学位期间完成的主要工作 |
致谢 |
(7)ProActive环境下并行程序容错调度的研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第1章 绪论 |
1.1 论文的背景 |
1.2 研究现状与发展趋势 |
1.2.1 分布式并行技术 |
1.2.2 分布式并行的调度技术 |
1.3 存在的问题 |
1.4 研究的意义和研究成果 |
1.5 文章的结构 |
第2章 ProActive的主要技术 |
2.1 引言 |
2.2 ProActive的简介 |
2.3 ProActive基本的分布式并行开发技术 |
2.3.1 活动对象 |
2.3.2 Type Group |
2.4 ProActive提供的容错机制 |
2.4.1 提供两种容错协议 |
2.4.2 容错服务器的定义和组成 |
2.4.3 容错服务器的启动 |
2.4.4 应用程序中容错机制的部署 |
2.5 ProActive提供的安全机制 |
2.5.1 基本模型 |
2.5.2 层次化的模型定义 |
2.5.3 安全机制的部署 |
2.6 本章小结 |
第3章 ProActive环境下的容错调度的研究 |
3.1 引言 |
3.2 并行分布式的容错技术 |
3.3 容错的并行计算平台的设计与实现 |
3.3.1 WPHPC平台 |
3.3.2 设计中考虑的因素 |
3.3.3 并行计算系统结构和工作流程 |
3.4 容错调度模型 |
3.4.1 节点的呼吸通信机制 |
3.4.2 故障节点的发现机制 |
3.4.3 容错调度机制 |
3.5 容错调度的算法 |
3.5.1 容错的池调度算法 |
3.5.2 容错的静态调度算法 |
3.5.3 容错的动态调度算法 |
3.6 应用实例的开发 |
3.7 实验和性能分析 |
3.7.1 实验 |
3.7.2 分析 |
3.8 本章小结 |
第4章 引入信任度的容错调度的研究 |
4.1 引言 |
4.2 信任度的引入 |
4.2.1 信任的定义 |
4.2.2 信任关系的分类 |
4.2.3 信任关系的性质 |
4.3 信任容错模型 |
4.3.1 信任管理模型 |
4.3.2 调度器 |
4.4 引入信任度的容错调度算法 |
4.4.1 引入信任度的池调度算法 |
4.4.2 引入信任度的静态调度算法 |
4.4.3 引入信任度的动态调度算法 |
4.5 实验与性能分析 |
4.5.1 实验 |
4.5.2 分析 |
4.6 本章小结 |
第5章 总结与展望 |
5.1 本文主要工作 |
5.2 展望 |
文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
(8)并行交通仿真模型及关键算法研究(论文提纲范文)
提要 |
第一章 绪论 |
1.1 论文选题背景与意义 |
1.1.1 课题来源 |
1.1.2 选题背景及意义 |
1.2 国内外研究概况 |
1.2.1 国外研究概况 |
1.2.2 国内研究概况 |
1.3 研究目标及主要内容 |
1.3.1 论文研究目标 |
1.3.2 主要研究内容 |
1.4 论文结构 |
第二章 并行计算与交通流建模理论 |
2.1 并行计算概述 |
2.1.1 并行计算的必要性 |
2.1.2 并行计算环境 |
2.2 交通流建模理论 |
2.2.1 交通流的基本特性 |
2.2.2 交通流理论发展概况 |
2.3 本章小结 |
第三章 微观交通仿真并行化方法与策略 |
3.1 微观交通仿真框架及流程 |
3.1.1 微观交通仿真框架 |
3.1.2 微观交通仿真流程 |
3.2 微观交通仿真模型 |
3.2.1 车辆产生模型 |
3.2.2 车辆跟驰模型 |
3.2.3 车辆换道模型 |
3.3 并行算法设计理论 |
3.3.1 并行算法基本概念 |
3.3.2 并行算法的设计方法 |
3.3.3 并行算法的设计过程 |
3.4 微观交通仿真并行化方法与策略 |
3.4.1 微观交通仿真并行化可行性分析 |
3.4.2 AIMSUN 仿真系统并行化方法 |
3.4.3 TRANSIMS 仿真系统并行化方法 |
3.4.4 本文中的微观仿真并行化方法与策略 |
3.5 本章小结 |
第四章 并行微观交通仿真关键算法 |
4.1 路网分割算法 |
4.1.1 路网表达 |
4.1.2 路网仿真数据相关性分析 |
4.1.3 路网分割算法实现 |
4.2 并行仿真同步策略 |
4.2.1 同步策略的分析比较 |
4.2.2 同步策略在并行交通仿真中的应用分析 |
4.2.3 适用于并行微观交通仿真的同步策略 |
4.3 动态负载平衡算法 |
4.3.1 负载平衡算法概述 |
4.3.2 动态负载平衡算法设计 |
4.4 本章小结 |
第五章 并行微观交通仿真系统设计与实现 |
5.1 交通网络数据表达方法 |
5.1.1 道路交通网络设施模型 |
5.1.2 交通网络仿真数据结构 |
5.1.3 路网表达信息表设计 |
5.2 仿真系统开发实现环境分析 |
5.2.1 硬件环境分析 |
5.2.2 软件环境分析 |
5.3 并行微观交通仿真系统实现 |
5.3.1 仿真系统功能描述与需求分析 |
5.3.2 并行交通仿真流程设计与实现 |
5.3.3 仿真系统运行界面 |
5.4 本章小结 |
第六章 并行交通仿真系统验证与应用 |
6.1 仿真系统有效性验证 |
6.1.1 实际路网交通数据采集 |
6.1.2 仿真结果验证分析 |
6.2 交通仿真并行效益分析 |
6.2.1 并行算法性能测度指标 |
6.2.2 交通仿真并行效益分析 |
6.3 TPSS 仿真系统应用 |
6.3.1 交通调查 |
6.3.2 交通特征分析 |
6.3.3 交通改造建议方案 |
6.3.4 改建前后的交通运行效果对比 |
6.4 本章小结 |
第七章 论文总结与展望 |
7.1 论文主要工作总结和创新 |
7.1.1 主要工作总结 |
7.1.2 主要创新点 |
7.2 有待进一步研究的问题 |
参考文献 |
致谢 |
攻读博士学位期间发表学术论文及其他成果 |
摘要 |
Abstract |
(9)基于MPI的集群计算系统设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 本文主要任务 |
1.4 论文结构 |
第2章 集群系统的概述 |
2.1 集群系统产生的原因 |
2.2 并行计算机体系结构 |
2.3 集群体系结构 |
2.3.1 集群系统分类 |
2.3.2 典型集群计算系统 |
2.4 单系统映像 |
2.4.1 SSI的目标 |
2.4.2 SSI的实现 |
2.4.3 SSI的边界 |
2.4.4 SSI基本特征 |
2.5 设计中间件的目标 |
2.6 负载平衡调度 |
2.7 集群进程间通信 |
2.8 本章小结 |
第3章 并行计算理论 |
3.1 并行程序设计 |
3.1.1 向量程序设计 |
3.1.2 共享存储并行程序设计 |
3.1.3 数据并行程序设计 |
3.1.4 消息传递并行程序设计 |
3.1.5 面向对象的并行程序设计 |
3.2 并行计算模型 |
3.3 并行算法设计技术 |
3.4 并行程序设计模型的评价标准 |
3.5 本章小结 |
第4章 MPI和 Linux内核研究 |
4.1 MPI分析 |
4.2 MPI通信分析 |
4.3 MPI并行程序设计模式 |
4.4 Linux内核研究 |
4.3 本章小结 |
第5章 集群计算系统的设计与实现 |
5.1 总体结构设计 |
5.2 软件环境 |
5.2.1 操作系统 |
5.2.2 RSH和 SSH规划 |
5.2.3 并行计算环境 |
5.3 硬件环境 |
5.4 集群系统体系结构 |
5.5 集群中间件的实现 |
5.5.1 节点注册模块 |
5.5.2 资源管理模块 |
5.5.3 作业分配模块 |
5.6 本章小结 |
第6章 集群性能测试和分析 |
6.1 并行计算的应用 |
6.2 系统黑盒测试 |
6.3 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(10)基于ProActive的并行计算技术研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第1章 绪论 |
1.1 论文研究的背景 |
1.2 相关研究工作与研究现状 |
1.2.1 并行计算技术概述 |
1.2.2 网络并行计算技术 |
1.2.3 传统的并行计算技术 |
1.2.4 基于java的并行计算技术 |
1.2.5 基于ProActive的并行计算技术 |
1.3 存在的问题 |
1.4 研究的意义和研究成果 |
1.5 文章的结构 |
第2章 基于ProActive的并行计算平台的设计 |
2.1 引言 |
2.2 ProActive介绍 |
2.3 体系结构 |
2.4 实现技术 |
2.4.1 部署文件及相关概念 |
2.4.2 SSH部署的解决方案 |
2.4.3 结点部署的过程 |
2.4.4 服务的发布 |
2.4.5 实验 |
2.5 本章小结 |
第3章 基于 ProActive并行程序设计方法 |
3.1 引言 |
3.2 ProActive的并行程序设计技术 |
3.2.1 活动对象 |
3.2.2 Future对象 |
3.2.3 广播与分派(Broadcast vs Dispatching) |
3.2.4 Type Group |
3.2.5 OOSPMD |
3.3 应用实例的开发 |
3.3.1 抽象类和接口 |
3.3.2 实例介绍 |
3.4 本章小结 |
第4章 基于ProActive的并行任务调度器 |
4.1 引言 |
4.2 调度算法研究现状 |
4.2.1 调度问题的定义 |
4.3 任务调度系统的结构及工作过程 |
4.4 任务调度算法 |
4.4.1 池算法 |
4.4.2 静态算法 |
4.4.3 动态算法 |
4.5 实验及分析 |
4.5.1 实验 |
4.5.2 分析 |
4.6 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
四、PVM并行程序向GAMMA迁移的方法(论文参考文献)
- [1]一种平台无关的并行编程模型的设计与实现[D]. 李婷. 中国科学技术大学, 2014(10)
- [2]面向分布存储结构的数据分布及代码生成技术研究[D]. 丁锐. 解放军信息工程大学, 2013(01)
- [3]面向CPU/GPU异构体系结构的并行计算关键技术研究[D]. 卢风顺. 国防科学技术大学, 2012(04)
- [4]基于MPI的并行数据库中间件的设计与实现[D]. 李娜. 西北大学, 2009(08)
- [5]EasyPAB:面向并行应用的辅助开发平台[D]. 于策. 天津大学, 2009(12)
- [6]移动代理计算模型及其在分布并行计算中的应用研究[D]. 黄永忠. 解放军信息工程大学, 2007(01)
- [7]ProActive环境下并行程序容错调度的研究[D]. 孙宇. 广西大学, 2007(05)
- [8]并行交通仿真模型及关键算法研究[D]. 倪安宁. 吉林大学, 2007(03)
- [9]基于MPI的集群计算系统设计与实现[D]. 姚成浪. 哈尔滨工程大学, 2007(04)
- [10]基于ProActive的并行计算技术研究[D]. 董明刚. 广西大学, 2006(12)