Moldex3D远端计算的常见问题之一
Moldex3D远程计算 ( Remote Computing ) 的常见错误 (Common errors of Moldex3D Remote Computing)
•process X exited without calling finalize
•Functions with MPI_ prefix are failed
•耗尽所有的端点
•使用者登入失败,错误1326
•凭证被拒绝
•创建失败 \\.......\....\console_redirection_.....log
•最大任务数为零
•Moldex3D 求解器在Windows Server 2019的不稳定性
•在 Windows 10 上 10 分钟后释放连入 SMB 连接
process X exited without calling finalize
•“Process X exited without call finalize”表示它已挂机,因为每个求解器进程在退出之前都必须叫出 “MPI_Finalize”。
•接下来,我们的工程师可以怎么做呢?
1.执行"Diagnostics" 诊断测试
2.使用同一组的计算资源来执行范例测试
-同一组的计算资源,意味着:
o使用相同的计算节点
o每个计算节点使用相同的核心数
如果以上两个步骤的结果显示为 ” no error” 没有错误,请联系求解器团队来做更进一步地调查。
Functions with MPI_ prefix are failed
•只有 < 1% 的此类错误与网络问题有关,> 99%的此类错误与求解器的错误有关。
•如果任何求解器进程挂机,则该进程与所有其他进程之间的 MPI 连接将终止。 这就是为什么显示“现有连接被远程主机强制关闭” 讯息的原因。
•“Process X exited without call finalize”表示它已挂机,因为每个求解器进程在退出之前都必须叫出 “MPI_Finalize”。
•接下来,我们的工程师可以怎么做呢?
1.执行 "Diagnostics" 诊断测试
2.使用同一组的计算资源来执行范例测试
-同一组的计算资源,意味着:
o使用相同的计算节点
o每个计算节点使用相同的核心数
如果以上两个步骤的结果显示为 ” no error” 没有错误,请联系求解器团队来做更进一步地调查。
耗尽所有的端点( Exhausted all end points )
•系统的网络资源耗尽
•接下来,我们的工程师可以怎么做呢?
-从丛集的所有节点中,卸除/禁用防病毒软件,然后再次执行分析。
o建议卸除。
-请检查是否安装了 “Moldex3D 远程计算 R11”。 如果是,请将其卸除。
o远程计算自R12以来是一个全新的架构。
o远程计算R11有缺陷(它并不是我方开发),我们的许多客户也都遭受系统资源耗尽的问题。
使用者登入失败,错误1326
•使用“以使用者身份执行”帐户登入系统失败。 “错误 1326” 是由未知的帐户或错误的密码所导致的。
•接下来,我们的工程师可以怎么做呢?
-进入主节点,打开 Moldex3D 工作排程器的服务配置。
-修改帐户/密码
-执行” diagnostic”诊断测试 ➜ 如果成功,请再次执行分析。
凭证被拒绝 (Credential is rejected)
•当凭证用于登入计算节点时,一个或多个计算节点拒绝该凭证。
•当您打开日志档案(log file),则可以看到拒绝该凭证节点的 IP 地址。
•接下来,我们的工程师可以怎么做呢?
-进入主节点,然后打开 Moldex3D 工作排程器的接口。
-执行 "diagnostic”诊断测试
-根据解决方法,进入拒绝凭证的计算节点,在Windows控制面板中修改密码。
创建失败 \\.......\....\console_redirection_.....log
•创建日志档案(log files)失败。 这是因为“以使用者身份执行”账户对工作活页夹没有权限。
•接下来,我们的工程师可以怎么做呢?
-进入主节点,然后打开 Moldex3D 工作排程器的接口。
-执行 ”diagnostic”诊断测试
o解决方案:
1.打开 Windows 档案总管。
2.进入工作活页夹本地路径(例如:D:\WorkingFolder)。
3.右键单击工作活页夹,并选择属性。
4.选择“分享”。
5.检查“以使用者身份执行”(例如:MDXParallelComputing)是否具有完全的控制权限。