Moldex3D高效能运算之远端计算 (Remote Computing)前言
• 远程计算 (Remote Computing)
远程计算 (RC) 是由计算管理器 (Computing Manager) 和工作排程器 (Job Scheduler) 所组合而成,远程计算协助使用者及管理者调度和执行工作分析。下面各节将详细介绍远程计算各模块,并在附录上说明每个按键功能。 基于在并行计算小节中以提到关于非服务器版本Windows的连入联机数量限制的因素,强烈建议使用这在远程计算的主节点上安装服务器版本的Windows。
远程计算架构
在远程计算的架构中,我们定义了三个角色,即:客户端、主节点、计算节点。
Moldex3D 2023 工作排程器会在主节点打开两个静态通讯端口并等待连接。10190埠用来让客户端的计算管理器发送命令,10119埠除了让计算节点的求解器发送结果之外也用来让主节点的工作排程器发送命令。当计算管理器开始进行上传/下载作业时,会透过22埠与主节点的OpenSSH server通讯。
在Moldex3D的计算管理器跟工作排程器之间所有的交流都是加密的。对于计算节点来说,10019埠的作用是和工作排程器交流。工作排程器会透过此通讯端口取得每个计算节点的数据。
布局1:三个角色分别位于不同台计算机
布局2:主节点和计算节点位于同一台计算机
布局3:所有角色位于同台计算机上
Moldex3D提供3种远程计算模式
•丛集(DMP)模式
丛集(DMP)模式的适用于一或多个客户端、一个主节点和多个计算节点的环境。
▪在此模式下,必须设定一个共享的文件夹与网络联机。
▪此外,在进行并行计算时需要有凭证(账号),使用者可以使用现有的账号或新创一个账号。
丛集(DMP)模式建议的的配置如同布局1。
•单节点模式
单节点模式适用于一或多个客户端和一个主/计算节点的环境。
▪在此模式下,不需要设定文件夹共享与网络联机。这可以减少多个系统问题。
▪此外,使用者不需要额外创建一个账号,可以使用当前的账户直接进行并行计算。
单节点模式建议的配置如同布局2和3。
•Microsoft HPC模式
Microsoft HPC 模式是整合了Moldex3D 的远程计算和 Microsoft HPC 的工作排程器。请参阅本章的 "Microsoft HPC 远程计算模式"。
并行计算架构
并行计算的架构只跟主节点与计算节点相关。
当开始执行上面的命令时,主节点上的impiexec.exe会透过主节点的网络路径要求计算节点的hydra_service.exe启动求解器。每个计算节点上的hydra_service.exe会透过并行计算的账号激活hydra_pmi_proxy.exe,接着hydra_pmi_proxy.exe会启动具有相同账号的求解器。
假设并行计算的账户是 "MDXParallelComputing",则此账号必须有执行求解器的权限,并且可以读取/编辑/删除项目文件的权限。这意指 "MDXParallelComputing" 必须有权限执行\\MasterNodeIP\Moldex3D_2023\Bin\Mdx3DFlowE.exe,同时具有权限读取/编辑/删除 \\MasterNodeIP\MDX_WorkingFolder\GearProject中的文件。
相关的详细数据,请参阅本章的 "Moldex3D远程计算目录权限配置"。
impiexec.exe、hydra_service.exe和hydra_pmi_proxy.exe位于C:\Program Files\Intel MPI 2019\x64中。
Moldex3D安装程序会自动将上述档案与\\MasterNodeIP\Moldex3D_2023\Bin里面所有的求解器加入主节点与所有计算节点的Windows防火墙安全名单中。如果节点中有安装任何防病毒软件或第三方防火墙程序,请手动将这些文件添加到安全名单中。
对于本机或单节点模式来说,并行计算在单一节点中执行,因此不需要网络联机。
上图显示为仅使用本机路径执行命令串。