NASA眼中CFD的未来(5)知识提取

路线图的知识提取领域包括集成数据库和数据可视化方向的时间表。

NASA眼中CFD的未来(5)知识提取的图1

该领域确定的总体目标与集成数据库系统的开发相关,该系统管理和处理大量非稳定模拟数据和测试数据,以实现不确定性量化工作流程,并能够对更大的数据集进行需求分析和可视化。

到2020年,目标技术里程碑是能够分析和可视化100亿节点的非定常CFD模拟,而且这个目标已经由NASA和NVIDIA在火星着陆器的仿真上实现。


什么是知识提取

知识提取 (Knowledge Extraction) 是指从结构化或非结构化数据源中提取有用的信息和知识。该技术可以用于从大量数据中提取出有用的信息、知识和模式,以帮助决策和智能分析。知识提取通常包括以下步骤:

  1. 数据收集和预处理:从各种数据源收集和整理数据,进行数据清洗和归一化等预处理步骤,以使数据能够被更好地分析。

  2. 实体识别:对数据中的实体(如人、地点、组织)进行识别和分类。

  3. 关系提取:识别实体之间的关系,并将它们表示为图或关系模型。

  4. 事件提取:从数据中提取出事件的关键信息,并将其表示为结构化的形式。

  5. 属性提取:提取出实体的属性(如年龄、性别、职业等)。

  6. 知识表示和存储:将提取的知识表示为结构化数据,如本体论或图数据库,并将其存储在知识库中。

知识提取在自然语言处理、计算机视觉、数据挖掘和机器学习等领域中得到广泛应用,可以用于信息抽取、智能搜索、机器翻译、自动问答和智能推荐等应用。

知识提取在计算流体力学(CFD)方面的应用可以帮助人们更好地理解流体力学问题并提高计算效率。以下是一些知识提取在CFD中的具体应用:

  1. 流场数据分析:CFD模拟产生的大量数据可以使用知识提取技术进行分析和处理。例如,可以使用机器学习方法提取出流场中的涡旋、湍流等特征,帮助工程师更好地理解流体力学问题。

  2. 几何建模:在CFD模拟中,几何模型是一个重要的输入参数。使用知识提取技术,可以自动从三维扫描数据中提取几何模型,减少手动建模的时间和成本。

  3. 建模参数选择:CFD模拟中需要选择一些建模参数,如网格大小、湍流模型等。使用知识提取技术,可以根据先前的模拟数据自动选择最优的建模参数,提高计算效率。

  4. 流动控制:使用知识提取技术,可以从先前的模拟数据中提取出控制流动的关键参数,如舵角、喷气方向等,帮助工程师制定更有效的控制策略。

总之,知识提取技术在CFD领域的应用可以帮助人们更好地理解流体力学问题,提高计算效率和预测精度。

行业进展

自发布该研究报告以来的六年中,CFD知识提取(KE)已经取得了重大进展。该研究认为,集成数据库和可视化技术将是实现2030年目标的关键。

在集成数据库方面,到2025年,将实现用于创建具有1000个非稳态CFD模拟加上所有数据源完整UQ的实时多保真度数据库的技术演示。在可视化方面,到2020年将进行一项技术演示,即对一个包含100亿点、非稳态CFD模拟进行按需分析/可视化。

有几项工作正在进行,以实现2025年数据库演示。剑桥大学的Graham Pullan一直在开发dbslice,这是一种基于Web的CFD后处理数据库方法。

NASA眼中CFD的未来(5)知识提取的图2

dbslice

同样,Intelligent Light一直在开发Spectre-UQTM,这是一种用于不确定性量化的基于Web的环境。

NASA眼中CFD的未来(5)知识提取的图3

Spectre

而ANSYS则正在开发Nexus,一种集成在Ansys EnSight产品中的报告生成、分析和数据存储框架。

NASA眼中CFD的未来(5)知识提取的图4

NASA眼中CFD的未来(5)知识提取的图5

Ansys Nexus

Sandia Analysis Workbench(SAW)是另一个允许用户在模型构建、网格生成、解决方案、后处理和UQ之间共享数据的功能。

NASA眼中CFD的未来(5)知识提取的图6

Sandia

所有这四个工具都使用基于Web服务器的数据处理和分析。通常会集成关系型数据库系统(例如Oracle®、PostGRES、SQLite),以存储和提供元数据、模拟和实验所需的数据,在分析、UQ或设计工作流程中不同部分需要使用它们。

虽然CFD社区内存在公开可用的数据库,然而这些数据并不易于整个社区访问,且对于高超声速模拟验证和验证(V&V)数据的存储库仍有迫切需求。例如,在高超声速模拟社区中,目前正在使用DNS模拟和实验数据作为“真理”,以推动改进壁面分辨大涡模拟(WR-LES)、壁面模化大涡模拟(WM-LES)、非定常雷诺平均纳维-斯托克斯方程(URANS)或RANS用于高超声速飞行器仿真和设计。但是,现有数据库是分布式的,并且不使用一致/协调的数据库架构,这使得难以轻松共享和使用数据。

通过可视化进行知识提取已经可以处理100亿个网格单元,在不稳定数据集的“按需分析/可视化”方面也取得了良好的进展。为了减少将大量数据写入磁盘并读回后再使用后处理工具进行可视化所带来的I/O开销,人们已经对原位/过境方法进行了相当多的开发。通过原位处理,流动求解器被配备了一个数据处理/可视化库(例如VisIt-Libsim 或Paraview-Catalyst ),该库与流动求解器共享内存空间。这种功能通常需要模拟代码暂停,而数据被处理时则无法继续运行。通过过境处理,模拟数据被传输到一组单独的计算节点上进行处理,并允许在传输完毕后恢复模拟运行。VisIt-Libsim、Paraview-Catalyst和其他科学数据处理库都具有独特的可视化和分析能力,用户可能想要在其特定模拟中使用它们。然而,开发人员可能不想只锁定于一个库中。Sensei是一种原位/过境基础设施,在求解器配备它之后,求解器可以使用任何原位/过境方法的功能。

NASA眼中CFD的未来(5)知识提取的图7

数据提取也可以是图像。在模拟执行时,可以生成图像文件。然而,如果用户仅保存单个图像或电影,则无法探索数据(缩放、平移、旋转、动画)。为了实现大型数据集的交互式可视化,洛斯阿拉莫斯国家实验室的Cinema技术利用从求解器通过原位/中转管道收集的许多不同视点的大量图像提取物集合。然后可以通过Cinema查看器、Web应用程序甚至通过Jupyter notebook 来查看这些图像。VisIt-Libsim和Paraview-Catalyst都能够输出Cinema提取数据库。

2017年,Jansen等人展示了使用Sensei和Paraview可视化和分析垂直尾部上的活动喷气分离流的50亿单元DDES模拟,如以下视频所示。

2015年,Tecplot开始探索可视化大规模数据集的要求。他们在桌面大小计算机系统上使用商业产品Tecplot来可视化来自经典1万亿单元数据集的数据集。

NASA眼中CFD的未来(5)知识提取的图8

Tecplot处理120GB数据耗时

参考资料

  1. G. Pullan, "A Web-Based Database Approach to CFD Post-Processing," in 55th AIAA Aerospace Sciences Meeting, Grapevine, TX, AIAA 2017-0814. 2017.

  2. E. Duque and S. Lawrence, "Spectre: A Computational Environment for Managing Total Uncertainty Quantification of CFD Studies," AIAA AIAA 2019-2221. 2019.

  3. E. K. Friedman-Hill, E. L. Hoffman, M. J. Gibson, R. L. Clay and K. H. Olson, "Incorporating Workflow for V&V/UQ in the Sandia Analysis Workbench," Sandia National Lab, Albuquerque,NM, SAND2015-0425C. 2015.

  4. R. Cumming, "private communication," Director of the Hypersonic Vehicle Simulation Institute (HVSI), US Air Force Academy.

  5. B. Whitlock, J. M. Favre and J. S. Meredith, "Parallel In Situ Coupling of Simulation with a Fully Featured Visualization System," in Eurographics Symposium on Parallel Graphics and Visualization, 2011.

  6. U. Ayachit, A. Bauer, B. Geveci, P. O'Leary, K. Moreland, N. Fabian and J. Mauldin, "Paraview catalyst: Enabling in situ data analysis and visualization," in Proceedings of the First Workshop on In Situ Infrastructures for Enabling Extreme-Scale Analysis and Visualization, Austin, TX, 2015.

  7. M. Larsen, J. Ahrens, U. Ayachit, E. Brugger, H. Childs, B. Geveci and C. Harrison, "The ALPINE In Situ Infrastructure: Ascending from the Ashes of Strawman," in SC '17: The International Conference for High Performance Computing, Networking, Storage and Analysis, Denver, 2017.

  8. U. Ayachit, B. Whitlock, M. Wolf, B. Loring, B. Geveci, D. Lonie and E. W. Bethel, "The SENSEI generic in situ interface," in Second Workshop on In Situ Infrastructures for Enabling Extreme-Scale Analysis and Visualization (ISAV), AIAA 40-44. 2016.

  9. A. C. Kirby, Z. Yang, D. Mavriplis, E. P. Duque and B. J. Whitlock, "Visualization and data analytics challenges of large-scale high-fidelity numerical simulations of wind energy applications," AIAA 2018-1171. 2018.

  10. T. L. Turton, D. Banesh, T. Overmyer, B. H. Sims and D. H. Rogers, "Enabling Domain Expertise in Scientific Visualization With CinemaScience," IEEE Computer Graphics and Applications, vol. 40,no. 1, pp. 90-98, 2020.

  11. K. E. Jansen, M. Rasquin, J. A. Farnsworth, N. Rathay, M. Mostriano and M. Amitay, "Interaction of a Synthetic Jet Actuator on Separated Flow over a Vertical Tail," AIAA Journal, vol. 56, no. 7,pp. 2653-2668, 2018.

  12. S. T. Imlay, C. A. Mackey and D. E. Taflin, "Visualizing a Trillion-Cell Simulated CFD Solution on an Engineering Workstation," in AIAA Fluid Dynamics Conference, AIAA 2018-3725. 2018

文章来源:基算仿真

默认 最新
当前暂无评论,小编等你评论哦!
点赞 评论 收藏
关注