【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块
在前面《DTEmpower核心功能技术揭秘》系列的文章中,我们提到了机器学习的一个经典理论:数据和特征决定了机器学习模型的上限,而算法则是在不断逼近这个上限。
如前文所述,基于这个经典理论,天洑软件自研了一系列的数据挖掘和探索技术,如HierarchicalStratify分层分类技术、AIOD智能异常点检测等技术,并集成于DTEmpower软件平台之中。这些技术都是针对机器学习模型上限的决定性因素-数据和特征提出的一系列提升方案。
我们在关注数据和特征的同时,需要注意到如何让算法逼近这个上限也是一个需要解决的问题。除了集成市面上常见的训练算法以供用户选择之外,天洑软件还针对工业设计数据的“小数据集”“数据分布不均”等特点,自主研发了AIAgent功能模块,并集成在DTEmpower软件平台中。
通过AIAgent模块,用户可以避免机械式的调参过程并节省大量的时间,这为在实际工业应用中落地数据驱动技术扫清了另一障碍,也是DTEmpower软件的另一大功能特色。
如图1所示,AIAgent功能模块配置简单,使用方便,用户根据实际问题简单搭配使用3个按钮,即可得到“最优”模型。
1. 风力机轮毂强度回归分析
① 数据集背景介绍:轮毂是风力发电机组中的关键零部件,在运行过程中可能会承受多种极端载荷的叠加作用,造成轮毂结构的破坏。因此需要对轮毂在不同载荷下的应力情况进行分析,并采用数据训练的手段建立载荷与轮毂应力之间的代理模型,进行快速评估。
② 建模和实验方法:采用图2所示的建模方法,对输入和输出之间的映射关系进行回归分析建模。该方法采用了Random Forest随机森林、GBDT(Gradient Boosting Decision Tree)梯度提升树、多项式拟合和AIAgent训练算法进行回归分析建模。然后对比不同模型的R2和NRMSE指标。
③ 实验结果:图3所示的实验结果表明,在风力机轮毂强度数据集上,AIAgent算法在5个输出变量上的性能指标均优于其他3种常见算法。
图3-2 针对风力机轮毂强度数据集,采用4种不同的算法算法对5个输出变量进行回归分析,比较其NRMSE指标可以发现基于AIAgent算法的模型在5个变量上的NRMSE误差指标均在0.01以下,而相比于其他3种算法,其NRMSE指标值均在0.02以上,甚至更高。结合图3-1,可以说明AIAgent在风力机轮毂数据集上的优越性
2. 船舶兴波阻力回归分析
① 数据集介绍:本方案中采用的数据集是经SHIPFLOW软件计算兴波阻力的数据集,该数据集输入参数是draft、Halfbeam、Height、Loa、BulbLengthChange,目标参数是兴波阻力eval_CWTWC。
② 建模方法:采用图4所示的建模方法,对输入和输出之间的映射关系进行回归分析建模。该方法采用了CART、Bagging、Adaboost 和AIAgent训练算法进行回归分析建模。然后对比不同模型的R2、MSE、MAPE等指标和在测试集上对目标变量的拟合误差。
图4 基于DTEmpower软件平台的船舶兴波阻力回归分析建模方案。其中AIAgent节点为本次实验中用到的回归训练算法,无需做过多的节点属性配置,用户即可搭建完整的建模流程。
③ 实验结果:通过表1和图5不难发现,在船舶兴波阻力数据集上,AIAgent训练算法的R2、NRMSE、MAPE等指标均优于其他3种训练算法,而在测试集上的拟合误差图也进一步说明了AIAgent训练算法相较于普通训练算法具有优越的泛化性能。
表1 基于AIAgent和其他3个训练算法的船舶兴波阻力回归模型的精度指标,通过表中数据可以看到,基于AIAgent训练算法的模型精度均高于其他算法,这表明了在兴波阻力数据集上AIAgent算法相较于其他3种算法的优越性
数据和特征决定了模型的上限,在如何让算法不断逼近这个上限的问题上,天洑软件针对“小数据集”自主研发了AIAgent功能模块,并集成在DTEmpower软件平台中。
在实际工业场景中的应用案例和对比实验,证明了AIAgent功能模块能轻松、有效的提高模型精度。在不同应用场景(如风力机强度回归分析和船舶兴波阻力回归分析)下的实验结果,也说明AIAgent功能模块的通用性和易用性。
DTEmpower不仅提供了一站式的数据建模解决方案,同时借助于AIAgent、异常点检测以及高维可视化等技术的加持,可以帮助用户快速、便捷的深入挖掘数据和特征,为建立高精度的数据模型提供了一条高效可落地的实现路径。
----------------The end----------------