• 中文核心期刊
  • 中国科技核心期刊
  • ISSN 1007-6336
  • CN 21-1168/X

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于模糊神经网络的广东省台风灾害损失预测

周纳 刘强

引用本文:
Citation:

基于模糊神经网络的广东省台风灾害损失预测

    作者简介: 周 纳(1994-),男,湖北黄冈人,硕士,主要研究方向为海洋灾害风险管理,E-mail:zhouna1919@163.com;
    通讯作者: 刘 强(1961-),男,山东青岛人,教授,主要研究方向为海洋灾害风险管理,E-mail:liuqiang@ouc.edu.cn
  • 基金项目: 国家自然科学基金项目(41072176,41371496);国家科技支撑计划项目(2013BAK05B04);国际科技合作重点项目(2009DFA22420)
  • 中图分类号: X4

Prediction of typhoon disaster losses in Guangdong province based on fuzzy neural networks

  • 摘要: 台风灾害是我国最严重的海洋灾害之一,研究提高台风灾害损失预测的准确度对防灾减灾具有重要意义。针对目前机器学习算法在处理小样本数据时预测精度不高的问题,提出结合模糊数学的BP神经网络算法对台风灾害损失进行预测。本文选用广东省2005-2016年记录较为完善的25个台风样本数据进行实验,首先利用信息扩散技术对初始数据进行正态信息扩散,再结合BP神经网络对台风灾害损失进行预测。结果表明,该方法能较好地解决台风灾害实测样本少和存在矛盾样本的问题,提高了台风灾害损失预测的精度。
  • 图 1  训练集模糊BP神经网络拟合结果

    Figure 1.  The predicted results of training set based on fuzzy BP neural network

    图 2  训练集BP神经网络拟合结果

    Figure 2.  The predicted results of training set based on BP neural network

    表 1  2005-2016年影响广东省的25场台风数据

    Table 1.  Data on 25 typhoons affecting Guangdong province from 2005 to 2016

    编号名称风速等级中心气压/hPa人均GDP/元人口密度/人·km−2医疗卫生机构个数/个地方财政收入/亿元
    510 珊瑚 12 982 24435 1362 16318 1807.2
    601 珍珠 15 960 28077 2674 16953 2179.46
    606 派比安 14 975 28077 2674 16953 2179.46
    707 帕布 8 990 33272 2686 16488 2785.8
    801 浣熊 7 998 37638 2370 15819 3310.32
    812 鹦鹉 14 1000 37638 2370 15819 3310.32
    814 黑格比 15 1000 37638 2370 15819 3310.32
    903 莲花 9 985 39436 2402 44314 3649.81
    907 天鹅 11 995 39436 2402 44314 3649.81
    1003 灿都 14 1003 44736 2428 44880 4517.04
    1006 狮子山 7 998 44736 2428 44880 4517.04
    1213 启德 13 998 54095 2927 46534 6229.18
    1306 温比亚 13 998 58833 3066 47835 7081.47
    1307 苏力 6 996 58833 3066 47835 7081.47
    1319 天兔 17 1002 58833 3066 47835 7081.47
    1407 海贝斯 10 988 63469 2999 48085 8065.08
    1409 威马逊 16 950 63469 2999 48085 8065.08
    1415 海鸥 14 998 63469 2999 48085 8065.08
    1522 彩虹 16 950 67503 3060 48320 9366.78
    1622 海马 13 998 74016 3193 49079 10390.35
    1621 莎莉嘉 12 998 74016 3193 49079 10390.35
    1510 莲花 13 990 67503 3060 48320 9366.78
    1311 尤特 15 996 58833 3066 47835 7081.47
    809 北冕 11 993 37638 2370 15819 3310.32
    518 达维 12 950 24435 1362 16318 1807.2
    下载: 导出CSV

    表 2  台风灾害损失评估指标体系

    Table 2.  Indicator system of evaluating typhoon disaster losses

    输入样本输出样本
    致灾源的危险性 风速等级 直接经济损失率
    中心气压
    承灾体的易损性 人均GDP
    人口密度
    承灾体的防灾减灾能力 医疗卫生机构个数
    地方财政收入
    下载: 导出CSV

    表 3  训练集不同模型误差和均方根误差汇总表

    Table 3.  A summary table of different model errors and root mean square error for the training set

    样本类型信息扩散的BP神经网络模型单BP神经网络模型
    误差均方根误差误差均方根误差
    训练集0.04120.14080.04690.1420
    测试集0.08430.10300.08970.1066
    下载: 导出CSV
  • [1] 樊 琦, 梁必骐. 热带气旋灾害经济损失的模糊数学评测[J]. 气象科学, 2000, 21(3): 360-366. doi: 10.3969/j.issn.1009-0827.2000.03.016
    [2] 孙绍骋. 灾害评估研究内容与方法探讨[J]. 地理科学进展, 2001, 20(2): 122-130. doi: 10.3969/j.issn.1007-6301.2001.02.004
    [3] ZHANG X C, LOU W P. Estimation of the number of collapsed houses damaged by typhoon based on principal components analysis and support vector machine[J]. Meteorological and Environmental Research, 2010, 1(4): 11-14.
    [4] 娄伟平, 陈海燕, 郑 峰, 等. 基于主成分神经网络的台风灾害经济损失评估[J]. 地理研究, 2009, 8(5): 1243-1254. doi: 10.3321/j.issn:1000-0585.2009.05.011
    [5] 刘少军, 张京红, 何政伟, 等. 基于GIS的台风灾害损失评估模型研究[J]. 灾害学, 2010, 25(2): 64-67. doi: 10.3969/j.issn.1000-811X.2010.02.013
    [6] 赵 飞, 廖永丰, 张妮娜, 等. 登陆中国台风灾害损失预评估模型研究[J]. 灾害学, 2011, 26(2): 81-85. doi: 10.3969/j.issn.1000-811X.2011.02.016
    [7] 陈仕鸿, 唐丹玲, 隋广军. 基于SVR的广东省台风灾害损失评估[J]. 海洋环境科学, 2013, 32(6): 939-943.
    [8] 李祚泳, 邓新民. 人工神经网络在台风预报中的应用初探[J]. 自然灾害学报, 1995, 4(2): 86-90.
    [9] 叶小岭, 施 珮, 匡 亮. 基于粒子群优化BP神经网络的台风灾损预测模型研究[J]. 灾害学, 2013, 28(4): 11-15,21. doi: 10.3969/j.issn.1000-811X.2013.04.003
    [10] 刘合香, 简茂球. 基于粒子群-投影寻踪和遗传-神经网络集成的预测模型[J]. 中山大学学报:自然科学版, 2012, 51(5): 113-119.
    [11] 张广平, 张晨晓, 谢 忠. 基于T-S模糊神经网络的模型在台风灾情预测中的应用——以海南为例[J]. 灾害学, 2013, 28(2): 86-89. doi: 10.3969/j.issn.1000-811X.2013.02.018
    [12] 林江豪, 阳爱民. 基于BP神经网络和VSM的台风灾害经济损失评估[J]. 灾害学, 2019, 34(1): 22-26. doi: 10.3969/j.issn.1000-811X.2019.01.005
    [13] 陈有利, 朱宪春, 胡 波, 等. 基于BP神经网络的宁波市台风灾情预估模型研究[J]. 大气科学学报, 2018, 41(5): 668-675.
    [14] HUANG C F. Fuzzy risk assessment of urban natural hazards[J]. Fuzzy Sets and Systems, 1996, 83(2): 271-282. doi: 10.1016/0165-0114(95)00382-7
    [15] 冯 倩, 刘 强. 基于SVM-BP神经网络的风暴潮灾害损失预评估[J]. 海洋环境科学, 2017, 36(4): 615-621.
    [16] 王甜甜, 刘 强. 基于BAS-BP模型的风暴潮灾害损失预测[J]. 海洋环境科学, 2018, 37(3): 457-463. doi: 10.12111/j.cnki.mes20180323
    [17] OSOWSKI S. Signal flow graphs and neural networks[J]. Biological Cybernetics, 1994, 70(4): 387-395. doi: 10.1007/BF00200336
    [18] YANG S, LIU X, LIU Q. A storm surge projection and disaster risk assessment model for China coastal areas[J]. Natural Hazards, 2016, 84(1): 649-667. doi: 10.1007/s11069-016-2447-1
    [19] RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323(6088): 533-536. doi: 10.1038/323533a0
    [20] HUANG C F. Principle of information diffusion[J]. Fuzzy Sets and Systems, 1997, 91(1): 69-90. doi: 10.1016/S0165-0114(96)00257-6
    [21] HUANG C F. MORAGA C. Extracting fuzzy if–then rules by using the information matrix technique[J]. Journal of Computer and System Sciences, 2005, 70(1): 26-52. doi: 10.1016/j.jcss.2004.05.001
  • [1] 李雅辰王胜强孙德勇焦红波张海龙 . 基于卫星遥感数据的东海浮游植物对台风响应研究. 海洋环境科学, 2022, 41(4): 519-525. doi: 10.12111/j.mes.20200260
    [2] 赵丹枫许强黄洲黄冬梅苏诚 . 基于相似阈值学习的台风路径分类方法. 海洋环境科学, 2022, 41(4): 644-652. doi: 10.12111/j.mes.20200070
    [3] 张雪薇韩震 . Argo温度数据的ConvGRU模型预测分析. 海洋环境科学, 2022, 41(4): 628-635. doi: 10.12111/j.mes.20210054
  • 加载中
图(2)表(3)
计量
  • 文章访问数:  279
  • HTML全文浏览量:  187
  • PDF下载量:  14
出版历程
  • 收稿日期:  2021-02-24
  • 录用日期:  2021-04-09
  • 刊出日期:  2022-06-20

基于模糊神经网络的广东省台风灾害损失预测

    作者简介:周 纳(1994-),男,湖北黄冈人,硕士,主要研究方向为海洋灾害风险管理,E-mail:zhouna1919@163.com
    通讯作者: 刘 强(1961-),男,山东青岛人,教授,主要研究方向为海洋灾害风险管理,E-mail:liuqiang@ouc.edu.cn
  • 中国海洋大学 工程学院, 山东 青岛 266100
基金项目: 国家自然科学基金项目(41072176,41371496);国家科技支撑计划项目(2013BAK05B04);国际科技合作重点项目(2009DFA22420)

摘要: 台风灾害是我国最严重的海洋灾害之一,研究提高台风灾害损失预测的准确度对防灾减灾具有重要意义。针对目前机器学习算法在处理小样本数据时预测精度不高的问题,提出结合模糊数学的BP神经网络算法对台风灾害损失进行预测。本文选用广东省2005-2016年记录较为完善的25个台风样本数据进行实验,首先利用信息扩散技术对初始数据进行正态信息扩散,再结合BP神经网络对台风灾害损失进行预测。结果表明,该方法能较好地解决台风灾害实测样本少和存在矛盾样本的问题,提高了台风灾害损失预测的精度。

English Abstract

  • 我国位于太平洋西岸,海岸线绵延18000多公里,是世界上遭受台风和风暴潮最严重、最频繁的区域之一,影响我国沿海的热带气旋每年约有16个,每年登陆的台风和热带风暴平均7个。台风登陆引起降水,可部分解决沿海干旱缺水问题,但更多时候,带来强降水、大风和风暴潮,常给当地造成灾害[1]。广东省是我国的经济大省,连续31年GDP位居我国首位,且广东省是我国遭受台风灾害最严重的地区之一。因此,关于广东省台风灾害的研究具有重大意义。

    台风灾害损失评估方法大致有数学模型法、实验模拟法、资料分析法和遥感GIS法[2]等。张新厂等[3]采用主成分分析和支持向量机技术,对房屋倒塌间数进行评估;娄伟平等[4]采用主成分神经网络,对台风灾害的经济损失进行评估;刘少军等[5]采用可拓分析方法,建立基于GIS的台风灾害损失评估模型,以实现台风灾害的动态评估;赵飞等[6]采用模糊数学法建立了台风灾害损失预评估模型,从而实现对台风灾情的定量预评估;陈仕鸿[7]利用SVR技术对广东省台风灾害进行损失评估。这些方法在台风灾害损失评估与预测方面得到了广泛应用。神经网络具有非线性、自学习、自组织和容错率等特点,成为台风灾害损失评估的重要方法,该方法的实质是通过分析台风样本数据信息,寻找输入数据和输出数据间极度复杂的非线性关系。李祚泳等[8]采用BP神经网络建立台风预报模型;叶小岭等[9]使用改进的BP神经网络建立台风灾损预测模型。然而研究结果表明,没有任何分析方法是万能的,神经网络也有诸多不能解决的问题,将其他方法和神经网络相结合,取长补短,一直以来是台风灾损预测的重要研究方向之一。为了克服BP神经网络的一些缺陷,如过度拟合、局部极小问题,很多学者将神经网络与遗传算法[10]、模糊理论[11]、空间向量模型[12]、灰色关联分析[13]等研究方法和模型相结合,建立台风灾损预测模型。然而,上述方法不能解决样本信息过少的问题,为了解决这一问题,本文将BP神经网络和信息扩散技术相结合,建立了一种新的预测台风灾损的模糊神经网络模型,在一定程度上解决小样本问题,并取得较好的预测效果。

    • 本文的台风数据主要来源于热带气旋年鉴、中国气象灾害年鉴、国家统计局、广东省统计局的相关数据。选取了广东省2005-2016年记录较为完善的25个台风样本作为样本数据。为避免主观选取的误差,随机选取20个样本为训练集,5个样本为测试集。台风数据如表1所示。

      编号名称风速等级中心气压/hPa人均GDP/元人口密度/人·km−2医疗卫生机构个数/个地方财政收入/亿元
      510 珊瑚 12 982 24435 1362 16318 1807.2
      601 珍珠 15 960 28077 2674 16953 2179.46
      606 派比安 14 975 28077 2674 16953 2179.46
      707 帕布 8 990 33272 2686 16488 2785.8
      801 浣熊 7 998 37638 2370 15819 3310.32
      812 鹦鹉 14 1000 37638 2370 15819 3310.32
      814 黑格比 15 1000 37638 2370 15819 3310.32
      903 莲花 9 985 39436 2402 44314 3649.81
      907 天鹅 11 995 39436 2402 44314 3649.81
      1003 灿都 14 1003 44736 2428 44880 4517.04
      1006 狮子山 7 998 44736 2428 44880 4517.04
      1213 启德 13 998 54095 2927 46534 6229.18
      1306 温比亚 13 998 58833 3066 47835 7081.47
      1307 苏力 6 996 58833 3066 47835 7081.47
      1319 天兔 17 1002 58833 3066 47835 7081.47
      1407 海贝斯 10 988 63469 2999 48085 8065.08
      1409 威马逊 16 950 63469 2999 48085 8065.08
      1415 海鸥 14 998 63469 2999 48085 8065.08
      1522 彩虹 16 950 67503 3060 48320 9366.78
      1622 海马 13 998 74016 3193 49079 10390.35
      1621 莎莉嘉 12 998 74016 3193 49079 10390.35
      1510 莲花 13 990 67503 3060 48320 9366.78
      1311 尤特 15 996 58833 3066 47835 7081.47
      809 北冕 11 993 37638 2370 15819 3310.32
      518 达维 12 950 24435 1362 16318 1807.2

      表 1  2005-2016年影响广东省的25场台风数据

      Table 1.  Data on 25 typhoons affecting Guangdong province from 2005 to 2016

      台风灾损影响因子的选取是有效预测的前提,直接决定最终预测的精准度。本文基于自然灾害风险分析[14]的原理,从致灾源的危险性、承灾体的易损性和承灾体的防灾减灾能力3个方面选取6个影响因子,即风速等级、中心气压、人均GDP、人口密度、医疗卫生机构个数、地方财政收入。为了避免通货膨胀对直接经济损失的影响,对直接经济损失这一指标进行预处理,得到直接经济损失率作为台风灾害损失输出数据。台风灾害损失评估指标体系如表2所示。

      输入样本输出样本
      致灾源的危险性 风速等级 直接经济损失率
      中心气压
      承灾体的易损性 人均GDP
      人口密度
      承灾体的防灾减灾能力 医疗卫生机构个数
      地方财政收入

      表 2  台风灾害损失评估指标体系

      Table 2.  Indicator system of evaluating typhoon disaster losses

    • BP神经网络[15-18]是一种模拟人类中枢神经系统结构和功能的神经网络算法。BP是一个多层的神经网络,它是基于一个由输入、输出和隐藏层组成的前向误差反向传播算法[19]。每一层包含多个神经元,它们位于连接到权重值的层之间。每个神经元的初始值定义为阈值。三层BP网络的数学模型的隐藏层神经元的输出表示为:

      式中:xihk分别是网络的输入值和隐藏层的输出值;LN是隐藏层神经元和输入层神经元的数目;kiwik分别是输入神经元、隐藏神经元和对隐藏层神经元的加权输入;θk表示隐藏层神经元的阈值。

      输出层神经元的输出表示为:

      式中: yjhk 分别是输出层的实际输出值和隐藏层的输出值;LM是隐藏层神经元和输出层神经元的个数;k j wkj 分别代表隐藏层神经元和输出层神经元对隐藏层神经元的权重;θj 表示输出层神经元的阈值。

      s型函数变换的神经元输出表示为:

      信息从输入层逐层传输,并与输出层的期望值进行比较。如果误差不能达到设定值,则通过连续不断的学习和反向传播来调整各层之间的权重和阈值,以获得误差最小的输出。

    • 鉴于自然灾害风险分析中经常遇到的不完全信息问题,黄崇福[20]通过长期实验、鉴定和多方面应用研究,系统地提出了一套基于模糊理论集处理不完整信息的理论技术(信息扩散技术)。信息扩散技术主要由信息矩阵[21]、信息分布和信息扩散三部分组成。信息扩散是一种对样本值进行模糊数学处理的方法,可以将单个值样本转换为集值样本。本文使用的模型是正态扩散模型。信息扩散技术的步骤如下:

      首先,根据统计的台风资料建立影响因子的样本集X

      其次,根据影响因子样本集的大小和样本元素的取值范围确定适当的步长,由此可生成影响因子的控制集(论域)U

      使用正态信息扩散公式(6),将样本集X中各个元素的xj所携带的信息按量qij分配给U中的点ui

      式中:uiuiU)是控制集中的样本吸收点;h称为窗宽,主要负责控制扩散的范围,与样本的个数N和样本数据中最大值最小值的差值有关。

      ba分别为影响因子样本集中观测到的最大值和最小值,令L=abs(b−a),则可得h的取值公式如下:

      最后,为保证所有影响因子样本点的地位相同,需要进行归一化处理。先计算出每个离散点xi的所有分配信息:

      从而得到样本集X在离散点集的归一化信息分布,即式(9)所示。

      式中:mU的离散点的个数。

    • 模糊BP神经网络模型建立的思路是先利用信息扩散技术对原始样本数据进行扩散得到新的输入数据,在此基础上通过设计调整Matlab神经网络工具箱的相应算法和参数进行模型训练。本文的输入样本为风速等级、中心气压、人均GDP、人口密度、医疗卫生机构个数、地方财政收入,输出样本为直接经济损失率,本次建模的目的就是找出6个输入样本和1个输出样本之间复杂的非线性关系。

      信息扩散的计算过程如下所示。

      步骤1: 各个输入数据离散点的确定。通过查阅各种文献发现,目前离散点个数的选取没有统一的方法,而离散点的个数又与输入数据的个数、样本容量和样本的分布相关,通过反复试算发现本研究选取5个离散点为宜,并取等步长。风速等级S、中心气压P、人均生产总值G、人口密度D、医疗卫生机构个数H、地方财政收入M各因子的离散点分别为:

      S(s1s2s3s4s5)=(6,8.75,11.5,14.25,17)

      P(p1p2p3p4p5)=(950,963.25,976.5,989.75,1003)

      G(g1g2g3g4g5)=(24435,36830.25,49225.5,61620.75,74016)

      D(d1d2d3d4d5)=(1362,1819.75,2277.5,2735.25,3193)

      H(h1h2h3h4h5)=(15819,24134,32449,40764,49079)

      M(m1m2m3m4m5)=(1807,3952.75,6098.5,8244.25,10390)

      步骤2: 窗宽h的确定。窗宽h的大小与样本的个数和样本数据中最大值最小值的差值有关,根据公式(7)得到各个输入数据的窗宽。

      风速等级:h=2.6851×(ba)/(n−1)=1.55

      中心气压:h=2.6851×(ba)/(n−1)=7.49

      人均GDP:h=2.6851×(ba)/(n−1)=7006.84

      人口密度:h=2.6851×(ba)/(n−1)=258.76

      医疗卫生机构个数:h=2.6851×(ba)/(n−1)=4700.34

      地方财政收入:h=2.6851×(ba)/(n−1)=1212.98

      步骤3: 信息扩散及归一化处理。

      将步骤1、2中得到的离散点、窗宽和原始数据带入公式(6)中进行信息扩散可以得到qsS),qpP),qgG),qdD),qhH),qmM),为了保证原始信息的地位相同,需要将经信息扩散得到的数据进行归一化处理,即将qij带入公式(9),最终得到一个经过模糊处理的数据集。

    • 本文随机选取20个台风样本为测试集(模糊处理过的数据集),另外5个样本为训练集(模糊处理过的数据集),借助Matlab2019b自带的神经网络工具箱进行训练。

      对BP神经网络而言,网络的层数与隐藏节点数的确定是预测精准度的关键,然而现阶段它们最优值的选取没有一个特别准确的方法。隐藏层数的取值范围为[1,25],经过反复试算,最终确定隐藏层数为9,而经信息扩散后的网络输入节点为30,故本BP神经网络的结构为30×9×1。其中,学习率取0.01,最大迭代次数取1000,目标误差取0.00001,网络的传递函数为单极性S函数。

      为检验预测的效果,本文对模糊BP神经网络模型和BP神经网络模型进行对比。为了避免客观因素对实验结果的影响,所有参数、网络的拓扑结构、传递函数都相同。训练集训练后BP神经网络模型和模糊BP神经网络模型的拟合效果图如图1图2所示。

      图  1  训练集模糊BP神经网络拟合结果

      Figure 1.  The predicted results of training set based on fuzzy BP neural network

      图  2  训练集BP神经网络拟合结果

      Figure 2.  The predicted results of training set based on BP neural network

      图1图2可知,模糊BP神经网络模型只有4个样本点拟合效果较差,拟合的成功率为80%,而对于BP神经网络模型而言,只有3个样本点拟合效果较好,拟合的成功率只有15%。只是从神经网络拟合结果图来评价拟合效果的好坏显然是不够的,为了保证评估的科学性、准确性,取误差和均方根误差作为评价指标,最终误差和均方根误差的统计值如表3所示。

      样本类型信息扩散的BP神经网络模型单BP神经网络模型
      误差均方根误差误差均方根误差
      训练集0.04120.14080.04690.1420
      测试集0.08430.10300.08970.1066

      表 3  训练集不同模型误差和均方根误差汇总表

      Table 3.  A summary table of different model errors and root mean square error for the training set

      表3可知,对于训练集而言,经过信息扩散的BP神经网络模型的误差相对于BP神经网络模型降低0.0057,而直接经济损失率本身较小,为0.11125,即模型提高了5.1%的准确度。因此,不论是模型拟合效果还是模型的误差,模糊BP神经网络模型都优于BP神经网络模型。

      再来分析一下模型的推广及预测能力,测试集模型的误差和均方根误差如表3所示,显然,经过信息扩散的BP神经网络模型的误差及均方根误差都要小于BP神经网络模型,说明经过信息扩散的BP神经网络模型在台风灾害损失预测方面有较好的分析能力。

    • 从广东省2005-2016年较为完整的25个历史台风数据样本出发,提出模糊BP神经网络算法对台风灾情进行研究。利用信息扩散技术对原始台风数据进行信息扩散,克服了小样本数据问题。模糊BP神经网络较BP神经网络在误差方面提高5.1%的准确度,模型拟合成功率高于BP神经网络模型65%。结果表明,该方法能较好地解决台风灾害实测样本少和存在矛盾样本的问题,提高了台风灾害损失预测的精度。

      将模糊数学的原理和BP神经网络相结合来预测台风的灾害损失是一次有意义的尝试,并且建立的台风灾损模型能较好地对台风直接经济损失进行预测。但是,本文没有对受灾人口、死亡人数、农田受灾面积等损失进行分析,今后将朝着这一方向继续研究,同时还会加强样本数据的整理工作,以期为我国的防灾减灾管理工作提供理论依据。

参考文献 (21)

目录

    /

    返回文章