数据驱动(DD)模型及其应用

2022-08-14 14:44:37 0 双良环境
数据驱动(DD)模型及其应用

  在SLR中发现了大量的DD建模技术,这些技术从简单的索引到机器学习算法都有。为了便于分析,将这些技术分类为五组:回归和指数、人工神经网络(ANN)、遗传规划(GP)、决策树(DT)和贝叶斯网络(BN)。大多数研究(使用DD建模的73篇文章中占63%)只用唯一一种方法来预测有害蓝藻水华。相比之下,37%的人使用了两种或两种以上的建模方法,其中18%的人用同一种DD建模技术,但是使用了多个变量。有19%的人使用两种或两种以上的DD建模技术,要么比较它们的性能,要么相互补充。表3列出了按DD建模技术分类的所有所综述的文章清单。

  表3. 按模型技术及其变量分组的已发布的数据驱动模型列表

回归和指数

  有几种机器学习算法的基础是线性和非线性回归和指标。在许多研究中已经应用简单的回归来预测湖泊特定区域的有害蓝藻水华情况,在此SLR中都被归类为回归模型。其他研究(极端事件分布、时间序列分析)依赖于数据模式的视觉识别和指数创建的统计评估,这些被归类为描述性统计模型。有学者采用多元线性回归和简单线性回归方法,评估比利时布鲁塞尔42个城市浅水混合城市池塘中有害蓝藻水华的风险。线性回归模型通常被用来确定发生在多个环境条件的特定阈值以上的高浓度蓝藻,如pH、水力停留时间和温度等。由此,应用条件概率方法根据环境条件评价有害蓝藻水华发生的可能性。有学者分析了巴西东北部地区的40座水库,通过线性回归评估了多个环境变量与有害蓝藻水华之间的相关性。干湿季节之间的季节性影响了水柱的稳定性,增加了有害蓝藻水华暴发的风险。有学者制定了澳大利亚昆士兰州东南部16座饮用水水库的风险指数,该指数基于流域放牧土地百分比、水库表面积、年龄和体积。该指数显示了有害蓝藻水华事件与夏季月份的季节性相关性,并允许在不同场景中创建有害蓝藻水华的敏感性预测。也有学者制定了一个指数,评估了中国鄱阳湖六个地区全年的有害蓝藻水华风险。结合历史水质数据确定了干湿季节之间的季节趋势。作者先确定了有害蓝藻水华风险较高的月份,以及有害蓝藻水华的主要驱动因素。通过线性回归对欧洲近500个湖泊进行了联合评估,最后确定有害蓝藻水华最好根据湖泊类型进行预测。作者还得出结论,一些湖泊类型可能更容易受到气候变化所引起的极端事件的影响,所以根据湖泊类型,地方适应性管理应该始终优先于普通管理实践。

  人工神经网络人工神经网络(ANN)是加权非线性回归和判别模型的组合,通常由多个相互连接的神经元组成。每个神经元都是一个计算元素,在这些神经元中进行线性或非线性回归。神经元在每层中连接和组织,其中一个是输入层,一个或多个是执行顺序计算的隐藏层,一个是结果所在的输出层。神经网络的主要特点是模拟大脑的活动,能够从数据中学习复杂的非线性关系。人工神经网络已应用于许多数据分析学科(例如水资源管理;包括有害蓝藻水华的预报)。基于人工神经网络的模型在日本Kasumigaura湖广泛应用,涉及到微囊藻和颤藻。有学者通过正向传播神经网络模拟微囊藻和颤藻,在5到40天的精度下,预测的结果是令人满意的。且前五天的预测精度最高。有学者用人工神经网络对Kasumigaura湖的五种藻类进行了预测,其中3种为蓝藻。为了确定种群迁移,在模型验证后还进行了敏感度分析。有学者继续用几种人工神经网络的训练方法和扩展预测五种蓝藻物种。研究发现,随着训练模式时间和事件分辨率的增加,在时间和数量上的精度都提高了。有学者用神经网络结合灵敏度分析和正交因子对Kasumigaura湖的4种优势蓝藻进行预测。此外这个技术还确定了每种物种的主要环境因子。阶乘的正交设计有助于验证物种的非生物因素,这能够支持类似减少内外营养盐负荷的决策。利用神经网络预报有害蓝藻水华的研究不仅仅局限于Kasumigaura湖。有学者利用小波分析开发了一种神经网络(WNN)。这个模型是在中国四岭水库开发的,模型进行了训练、验证和测试,并应用于美国Winnebago湖。

  • 上一个:基于过程的(PB)模型及其应用
  • 下一个:遗传程序设计
  • 当前页面链接:https://www.slgpt.com/kpkt/534.html
  • 声明:所载内容来源互联网,仅供参考,交流之目的,转载的稿件版权归原创和机构所有,如有侵权,请联系我们删除。

相关工程案例
相关新闻推荐