【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块



【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图1


概述 

在前面《DTEmpower核心功能技术揭秘》系列的文章中,我们提到了机器学习的一个经典理论:数据和特征决定了机器学习模型的上限,而算法则是在不断逼近这个上限。

如前文所述,基于这个经典理论,天洑软件自研了一系列的数据挖掘和探索技术,如HierarchicalStratify分层分类技术AIOD智能异常点检测技术,并集成于DTEmpower软件平台之中。这些技术都是针对机器学习模型上限的决定性因素-数据和特征提出的一系列提升方案。

我们在关注数据和特征的同时,需要注意到如何让算法逼近这个上限也是一个需要解决的问题。除了集成市面上常见的训练算法以供用户选择之外,天洑软件还针对工业设计数据的“小数据集”“数据分布不均”等特点,自主研发了AIAgent功能模块,并集成在DTEmpower软件平台中。

通过AIAgent模块,用户可以避免机械式的调参过程并节省大量的时间,这为在实际工业应用中落地数据驱动技术扫清了另一障碍,也是DTEmpower软件的另一大功能特色。

AIAgent功能模块简介 

如图1所示,AIAgent功能模块配置简单,使用方便,用户根据实际问题简单搭配使用3个按钮,即可得到“最优”模型。

【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图2
图1  AIAgent模块在使用神经网络(径向基核函数网络)的基础上,根据大量的工程案例总结,引入“正则多项式”组合的形式构建鲁棒性更强的、适用于工业问题的学习算法。同时AIAgent节点配置简单,无需配置过多参数,只需要根据实际问题打开或关闭“超参优化”、“小数据集优化”和“交叉验证”开关,用户即可一键得到“最优”模型
基于AIAgent智能训练算法的建模实验 

1. 风力机轮毂强度回归分析

① 数据集背景介绍:轮毂是风力发电机组中的关键零部件,在运行过程中可能会承受多种极端载荷的叠加作用,造成轮毂结构的破坏。因此需要对轮毂在不同载荷下的应力情况进行分析,并采用数据训练的手段建立载荷与轮毂应力之间的代理模型,进行快速评估。

模型所采用的数据集中含有3个输入变量和5个输出变量,共193个样本:输入变量为一组轮毂上三个扭矩,输出变量为五个节点的应力。

② 建模和实验方法:采用图2所示的建模方法,对输入和输出之间的映射关系进行回归分析建模。该方法采用了Random Forest随机森林、GBDT(Gradient Boosting Decision Tree)梯度提升树、多项式拟合和AIAgent训练算法进行回归分析建模。然后对比不同模型的R2和NRMSE指标。

【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图3

图2 针对风力机轮毂强度数据集,在DTEmpower软件平台上搭建回归分析的建模方案。DTEmpower提供了一站式的数据建模解决方案,通过简单的节点拖拽即可搭建完整的建模流程。其中AIAgent具有非常简单的节点配置属性,用户仅通过“超参优化”、“小数据集优化”和“交叉验证”三个开关的搭配使用即可得到“最优”模型

③ 实验结果:图3所示的实验结果表明,在风力机轮毂强度数据集上,AIAgent算法在5个输出变量上的性能指标均优于其他3种常见算法。

【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图4
图3-1 采用4种不同的算法对5个输出变量进行回归分析,比较其R2精度指标可以发现蓝色柱子所示的基于AIAgent算法的模型在5个输出变量上的R2指标均在0.99以上,甚至非常逼近于1。而相较于其他3种算法的R2值均在0.99以下,AIAgent算法具有非常明显的优势。 【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图5

图3-2 针对风力机轮毂强度数据集,采用4种不同的算法算法对5个输出变量进行回归分析,比较其NRMSE指标可以发现基于AIAgent算法的模型在5个变量上的NRMSE误差指标均在0.01以下,而相比于其他3种算法,其NRMSE指标值均在0.02以上,甚至更高。结合图3-1,可以说明AIAgent在风力机轮毂数据集上的优越性

2. 船舶兴波阻力回归分析

① 数据集介绍:本方案中采用的数据集是经SHIPFLOW软件计算兴波阻力的数据集,该数据集输入参数是draft、Halfbeam、Height、Loa、BulbLengthChange,目标参数是兴波阻力eval_CWTWC。 

② 建模方法:采用图4所示的建模方法,对输入和输出之间的映射关系进行回归分析建模。该方法采用了CART、Bagging、Adaboost 和AIAgent训练算法进行回归分析建模。然后对比不同模型的R2、MSE、MAPE等指标和在测试集上对目标变量的拟合误差。

【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图6

图4 基于DTEmpower软件平台的船舶兴波阻力回归分析建模方案。其中AIAgent节点为本次实验中用到的回归训练算法,无需做过多的节点属性配置,用户即可搭建完整的建模流程。

③ 实验结果:通过表1和图5不难发现,在船舶兴波阻力数据集上,AIAgent训练算法的R2、NRMSE、MAPE等指标均优于其他3种训练算法,而在测试集上的拟合误差图也进一步说明了AIAgent训练算法相较于普通训练算法具有优越的泛化性能。

表1 基于AIAgent和其他3个训练算法的船舶兴波阻力回归模型的精度指标,通过表中数据可以看到,基于AIAgent训练算法的模型精度均高于其他算法,这表明了在兴波阻力数据集上AIAgent算法相较于其他3种算法的优越性

【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图7

【新闻】DTEmpower核心功能技术揭秘(5) - AIAgent模块的图8

图5 基于不同算法的回归模型在测试集上真实值和预测值的预测误差,蓝色曲线代表AIAgent算法的拟合误差,不难发现AIAgent算法的拟合误差基本都在0值上下波动,且波动范围小于其他3种算法的拟合误差,这说明了AIAgent算法对于测试集数据具有强于其他3种算法的泛化能力
总结 

数据和特征决定了模型的上限,在如何让算法不断逼近这个上限的问题上,天洑软件针对“小数据集”自主研发了AIAgent功能模块,并集成在DTEmpower软件平台中。

在实际工业场景中的应用案例和对比实验,证明了AIAgent功能模块能轻松、有效的提高模型精度。在不同应用场景(如风力机强度回归分析和船舶兴波阻力回归分析)下的实验结果,也说明AIAgent功能模块的通用性和易用性。

DTEmpower不仅提供了一站式的数据建模解决方案,同时借助于AIAgent、异常点检测以及高维可视化等技术的加持,可以帮助用户快速、便捷的深入挖掘数据和特征,为建立高精度的数据模型提供了一条高效可落地的实现路径。


----------------The end----------------

默认 最新
当前暂无评论,小编等你评论哦!
点赞 评论 收藏
关注