• 中文核心期刊
  • 中国科技核心期刊
  • ISSN 1007-6336
  • CN 21-1168/X

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于随机森林的入海污染源对海湾环境容量的影响排序研究

邹佳奇 张亦飞 方欣 李晓燕 连娉婷 吴逸凡

引用本文:
Citation:

基于随机森林的入海污染源对海湾环境容量的影响排序研究

    作者简介: 邹佳奇(1995-),男,浙江温州人,硕士研究生,主要从事海洋空间规划研究,E-mail:17826851976@163.com;
    通讯作者: 张亦飞(1964-),男,E-mail:zhang1213@163.com
  • 基金项目: 中央级公益性科研院所基本科研业务费专项资金项目(JG1917);国家海洋公益性行业科研专项项目(2011009)
  • 中图分类号: X55

Impact ranking of pollution source discharge on the bay environmental capacity based on the random forest algorithm

  • 摘要: 海水水质对海湾生态系统健康具有重要影响,而基于环境容量的入海污染物总量控制是改善海湾水体质量的前提和基础。本研究从分析水质目标约束下污染源对环境容量影响的非线性关系入手,结合随机森林(random forest)分类方法和常规水质模型,对海南省陵水县新村潟湖入海污染源对海湾环境容量的影响进行了研究。结果显示,在渔排养殖、城镇污水和径流注入3类共41个影响潟湖无机氮和活性磷酸盐浓度的主要污染源中,10个污染源对环境容量存在全局性影响;渔排养殖是影响潟湖无机氮环境容量的主要因素;渔排养殖、城镇污水和径流注入污染源对活性磷酸盐环境容量的影响程度差异不大。
  • 图 1  研究区地理位置及海洋功能区划

    Figure 1.  Location of study area and marine functional zoning

    图 2  新村潟湖污染源位置

    Figure 2.  Distribution of pollution sources in Xincun lagoon

    图 3  研究区水质监测站位

    Figure 3.  Water quality monitoring stations in the study area

    图 4  径流污染的响应场

    Figure 4.  Response field of unit source

    图 5  研究区域无机氮和活性磷酸盐超标情况(红色为超标区域,绿色为未超标区域)

    Figure 5.  Over standard of inorganic nitrogen and phosphate in the study area(red is the area exceeding the standard, and green is the area not exceeding the standard)

    图 6  分类精度与污染源数量的关系

    Figure 6.  Relationship between classification accuracy and quantity of pollution sources

    图 7  曲港河和曲沟河活性磷酸盐减排后达标面积的变化

    Figure 7.  Area increase meeting water quality requirements of phosphate in Qugang river and Qugou river after emission reduction

    表 1  2017年6月影响新村潟湖污染源TN、TP排放量的统计数据

    Table 1.  Statistical characteristics of TN and TP emissions from pollution sources in June 2017

    污染物种类统计
    特征值/kg
    排污口类型
    渔排
    yp1-yp29
    城镇排污
    cz1-cz9
    径流注入
    TN最大17867.128339.188413.4
    最小1471.6508.95216.6
    平均6371.44826.938214.9
    TP最大2970.72036.115611.8
    最小233.436.6631.4
    平均1019.7346.87740.9
    下载: 导出CSV

    表 2  无机氮污染源影响排序

    Table 2.  Impact ranking of inorganic nitrogen pollution sources

    污染源编号MDG污染源编号MDG污染源编号MDG污染源编号MDG
    yp21 44.21 yp19 36.82 yp3 29.09 yp23 27.40
    yp20 42.77 qgh2 33.59 yp22 28.88 yp25 26.50
    cz9 40.75 yp18 33.03 yp4 28.58 yp10 25.51
    yp8 38.20 qgh1 31.28 yp17 28.13 yp9 24.83
    下载: 导出CSV

    表 3  活性磷酸盐污染源影响排序

    Table 3.  Impact ranking of phosphorus pollution sources

    污染源编号MDG污染源编号MDG污染源编号MDG污染源编号MDG污染源编号MDG
    cz763.71yp131.59yp2623.33yp917.77yp1816.24
    qgh247.57yp330.78yp2721.89yp817.30yp416.18
    yp1644.99yp2930.50cz919.81cz417.25yp1315.83
    qgh137.40yp2825.58rhk118.23yp616.63cz814.88
    yp231.81yp525.01yp2117.92yp1916.33yp1214.60
    下载: 导出CSV
  • [1] 陈则实, 王文海, 吴桑云. 中国海湾引论[M]. 北京: 海洋出版社, 2007: 1-8.
    [2] 李永祺, 唐学玺. 海洋恢复生态学[M]. 青岛: 中国海洋大学出版社, 2016: 134-165.
    [3] ONDIVIELA B, RECIO M, JUANES J A. A management approach for the ecological integrity of NE Atlantic estuaries[J]. Ecological Indicators, 2015, 52: 105-115. doi: 10.1016/j.ecolind.2014.12.003
    [4] 中华人民共和国生态环境部. 中国海洋生态环境状况公报[R]. 北京: 中华人民共和国生态环境部, 2015-2019.
    [5] COOK G S, FLETCHER P J, KELBLE C R. Towards marine ecosystem based management in South Florida: investigating the connections among ecosystem pressures, states, and services in a complex coastal system[J]. Ecological Indicators, 2014, 44: 26-39. doi: 10.1016/j.ecolind.2013.10.026
    [6] 马 镛, 张亦飞, 祁 琪, 等. 基于复杂网络的海洋生态系统压力影响量化方法及应用[J]. 海洋环境科学, 2019, 38(3): 446-453. doi: 10.12111/j.mes20190319
    [7] 刘鸿亮. 总量控制技术手册[M]. 北京: 中国环境科学出版社, 1990.
    [8] 朱 静, 王靖飞, 田在峰, 等. 海洋环境容量研究进展及计算方法概述[J]. 水科学与工程技术, 2009 (4): 8-11. doi: 10.3969/j.issn.1672-9900.2009.04.003
    [9] 黄秀清. 乐清湾海洋环境容量及污染物总量控制研究[M]. 北京: 海洋出版社, 2011: 252–345.
    [10] 栗苏文, 李红艳, 夏建新. 基于Delft 3D模型的大鹏湾水环境容量分析[J]. 环境科学研究, 2005, 18(5): 91-95. doi: 10.3321/j.issn:1001-6929.2005.05.023
    [11] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324
    [12] GENUER R, POGGI J M, TULEAU-MALOT C. Variable selection using random forests[J]. Pattern Recognition Letters, 2010, 31(14): 2225-2236. doi: 10.1016/j.patrec.2010.03.014
    [13] 游介文, 邹 滨, 赵秀阁, 等. 基于随机森林模型的中国近地面NO2浓度估算[J]. 中国环境科学, 2019, 39(3): 969-979. doi: 10.3969/j.issn.1000-6923.2019.03.009
    [14] 常晓敏, 余新晓, 贾国栋, 等. 基于随机森林的不同径级树木死亡影响因子研究[J]. 生态学报, 2019, 39(21): 8003-8009.
    [15] 王李娟, 孔钰如, 杨小冬, 等. 基于特征优选随机森林算法的农耕区土地利用分类[J]. 农业工程学报, 2020, 36(4): 244-250. doi: 10.11975/j.issn.1002-6819.2020.04.029
    [16] PARRAVICINI V, ROVERE A, VASSALLO P, et al. Understanding relationships between conflicting human uses and coastal ecosystems status: a geospatial modeling approach[J]. Ecological Indicators, 2012, 19: 253-263. doi: 10.1016/j.ecolind.2011.07.027
    [17] 杨 阳, 高 抒, 周 亮, 等. 海南新村港潟湖表层沉积物粒度特征及其沉积环境[J]. 海洋学报, 2016, 38(1): 94-105.
    [18] 杨 阳, 高 抒, 周 亮, 等. 海南岛东南部新村港和黎安港潮汐特征及潮汐汊道P-A关系[J]. 第四纪研究, 2016, 36(1): 163-172. doi: 10.11928/j.issn.1001-7410.2016.16
    [19] 张际标, 张 鹏, 戴培东, 等. 海南岛近岸海域溶解无机磷时空分布及富营养化[J]. 中国环境科学, 2019, 39(6): 2541-2548. doi: 10.3969/j.issn.1000-6923.2019.06.037
    [20] 第一次全国污染源普查资料编纂委员会. 污染源普查产排污系数手册[M]. 北京: 中国环境科学出版社, 2011.
    [21] XU Z H, HUANG X Y, LIN L, et al. BP neural networks and random forest models to detect damage by Dendrolimus punctatus walker[J]. Journal of Forestry Research, 2020, 31(1): 107-121. doi: 10.1007/s11676-018-0832-1
    [22] DHI. MIKE 21 & MIKE 3 flow model hydrod- ynamics and transport moduel science documentation[M]. Denmark: DHI Water & Environment, 2014.
    [23] 林志兰, 王 灏, 王金坑, 等. 2009年罗源湾表层海水DIN与TN及PO4-P与TP浓度换算系数的研究[J]. 应用海洋学学报, 2014, 33(4): 562-566. doi: 10.3969/J.ISSN.2095-4972.2014.04.015
    [24] 吴孝情, 赖成光, 陈晓宏, 等. 基于随机森林权重的滑坡危险性评价: 以东江流域为例[J]. 自然灾害学报, 2017, 26(5): 119-129.
    [25] HAN H, GUO X L, YU H. Variable selection using mean decrease accuracy and mean decrease gini based on random forest[C]//2016 7th IEEE International Conference on Software Engineering and Service Science. Beijing: IEEE, 2016: 219–224.
    [26] 姚登举, 杨 静, 詹晓娟. 基于随机森林的特征选择算法[J]. 吉林大学学报: 工学版, 2014, 44(1): 137-141.
  • [1] 顾杰李正尧冒小丹胡成飞匡翠萍张万磊 . 夏季北戴河海域COD环境容量研究. 海洋环境科学, 2017, 36(5): 682-687. doi: 10.13634/j.cnki.mes.2017.05.007
    [2] 吴燕妮李冬玲叶林安徐皓李加林 . 象山港海域水质与沉积物主要污染因子及污染源分析. 海洋环境科学, 2017, 36(3): 328-335. doi: 10.13634/j.cnki.mes.2017.03.002
    [3] 马新东林忠胜王立军穆景利于丽敏王燕张哲张志锋 . 大连湾海域水质主要污染因子及污染源贡献分析. 海洋环境科学, 2016, 35(3): 417-421. doi: 10.13634/j.cnki.mes.2016.03.015
    [4] 熊兰兰黄小平张景平张凌江志坚 . 基于生态系统的海湾综合管理框架及调控策略. 海洋环境科学, 2020, 39(2): 203-210. doi: 10.12111/j.mes20200206
    [5] 李若华朱军政尤爱菊韩曾萃赵坤 . 基于潮汐时变特征的水质时空双重达标控制标准. 海洋环境科学, 2016, 35(2): 295-300. doi: 10.13634/j.cnki.mes.2016.02.024
    [6] 罗满华李海龙肖凯黄浩 . 胶州湾与大亚湾不同类型湿地对无机氮、磷的净化评估. 海洋环境科学, 2020, 39(6): 860-866. doi: 10.12111/j.mes.20190213
    [7] 杨一李维尊张景凯王京钰 .  渤海湾天津海域海洋环境污染防治策略探讨. 海洋环境科学, 2016, 35(1): 49-54. doi: 10.13634/j.cnki.mes.2016.01.008
    [8] 孙钦帮高范王阳张冲崔雷 . 广东红海湾海域表层水环境中重金属含量特征及污染评价. 海洋环境科学, 2018, 37(5): 685-690, 698. doi: 10.12111/j.cnki.mes20180509
    [9] 陈晓冉陈燕珍屠建波张春鹏高文胜巩瑶 . 渤海湾天津近岸典型海域PBDEs污染状况及分布规律研究. 海洋环境科学, 2020, 39(3): 413-418. doi: 10.12111/j.mes20200314
    [10] 魏虎进黄华梅张晓浩 . 基于生态系统服务功能的海湾滩涂资源环境承载力研究——以大亚湾为例. 海洋环境科学, 2018, 37(4): 579-585. doi: 10.12111/j.cnki.mes20180415
    [11] 王彬崔健李玲石海明王嘉琦刘春琳 . 渤海湾赤潮特征研究. 海洋环境科学, 2021, 40(2): 200-206. doi: 10.12111/j.mes.20190242
    [12] 廖国祥叶金清韩俊松刘长安 . 综合随机和典型情景模拟的海洋溢油事故污染危害预测评估研究. 海洋环境科学, 2017, 36(2): 266-273. doi: 10.13634/j.cnki.mes.2017.02.017
    [13] 郭建丽王玥李江宇明红霞苏洁关道明王斌樊景凤 . 大连重要海水增养殖区粪便污染指示菌和弧菌的时空分布. 海洋环境科学, 2017, 36(6): 813-819. doi: 10.13634/j.cnki.mes.2017.06.003
    [14] 李明昌戴明新邹斌崔雷 . 海域移动源溢油污染事件寻源搜索方法研究. 海洋环境科学, 2017, 36(6): 924-928, 940. doi: 10.13634/j.cnki.mes.2017.06.020
    [15] 李保石厉丞烜金玉休纪鹏赵晓龙何帅 . 广海湾海域营养盐时空分布及富营养化评价. 海洋环境科学, 2020, 39(5): 657-663. doi: 10.12111/j.mes.20190171
    [16] 张秀芝张拂坤邱金泉刘淑静王静张雨山 . 浓盐水排海对渤海湾盐度分布的影响预测. 海洋环境科学, 2016, 35(3): 404-409. doi: 10.13634/j.cnki.mes.2016.03.013
    [17] 王瑜刘录三朱延忠林岿璇周娟夏阳 . 渤海湾近岸海域春秋季网采浮游植物群落特征. 海洋环境科学, 2016, 35(4): 564-570. doi: 10.13634/j.cnki.mes.2016.04.014
    [18] 牛淑杰李茂田同萌刘晓强林沐东尹国宇 . 三沙湾水质分布特征对陆源污染、湾内养殖的响应. 海洋环境科学, 2021, 40(1): 41-49. doi: 10.12111/j.mes.20190186
    [19] 李京梅苏红岩 . 基于DEA-Malmquist方法我国海洋陆源污染治理效率评价. 海洋环境科学, 2016, 35(4): 512-519. doi: 10.13634/j.cnki.mes.2016.04.006
    [20] 刘宪杰洪文俊王荦贾宏亮李一凡 . 大连近海沉积物多环芳烃污染特征及源解析. 海洋环境科学, 2016, 35(2): 252-255. doi: 10.13634/j.cnki.mes.2016.02.017
  • 加载中
图(7)表(3)
计量
  • 文章访问数:  1311
  • HTML全文浏览量:  424
  • PDF下载量:  19
出版历程
  • 收稿日期:  2020-08-24
  • 录用日期:  2020-12-20
  • 刊出日期:  2021-10-20

基于随机森林的入海污染源对海湾环境容量的影响排序研究

    作者简介:邹佳奇(1995-),男,浙江温州人,硕士研究生,主要从事海洋空间规划研究,E-mail:17826851976@163.com
    通讯作者: 张亦飞(1964-),男,E-mail:zhang1213@163.com
  • 1. 自然资源部第二海洋研究所 海洋工程勘测设计研究院,浙江 杭州 310012
  • 2. 杭州国海海洋工程勘测设计研究院,浙江 杭州 310012
基金项目: 中央级公益性科研院所基本科研业务费专项资金项目(JG1917);国家海洋公益性行业科研专项项目(2011009)

摘要: 海水水质对海湾生态系统健康具有重要影响,而基于环境容量的入海污染物总量控制是改善海湾水体质量的前提和基础。本研究从分析水质目标约束下污染源对环境容量影响的非线性关系入手,结合随机森林(random forest)分类方法和常规水质模型,对海南省陵水县新村潟湖入海污染源对海湾环境容量的影响进行了研究。结果显示,在渔排养殖、城镇污水和径流注入3类共41个影响潟湖无机氮和活性磷酸盐浓度的主要污染源中,10个污染源对环境容量存在全局性影响;渔排养殖是影响潟湖无机氮环境容量的主要因素;渔排养殖、城镇污水和径流注入污染源对活性磷酸盐环境容量的影响程度差异不大。

English Abstract

  • 海湾地处海陆交互带,优越的区位和丰富的资源赋存,使其成为区域经济社会活动的密集区[1]。高强度的人类活动,给海湾生态环境带来了巨大的压力[2-3]。2015-2019年5年的近岸生态环境资料显示,我国面积大于100 km2的44个重点海湾,超过1/3(部分年度接近一半)的海湾,由于无机氮、活性磷酸盐等超标出现劣四类水质[4]。其他面积较小的海湾,由于对人类活动的响应更为敏感,水质状况同样不容乐观,从而影响海湾生态系统健康。案例研究表明,水体质量在海湾生态系统网络中具有重要地位,陆源和海上污染物进入海湾,首先影响水体质量,继而影响生物和生态系统状况[5-6],因此,改善海湾生态系统健康,提升水体质量是关键。

    排污总量控制是一种通过控制入海污染物总量及各污染源排放量的分配,使目标海域污染物浓度保持在规定限度内的污染控制方法,是改善海湾水体质量的重要措施[7]。环境容量(也称“允许排放量”)计算是实施污染物总量控制的前提和基础。20世纪80年代初以来,诸多学者从不同的视角对海湾环境容量开展了大量的研究,提出了模型试算法、均匀混合法、分担率法、最优化法、地统计学和GIS方法等一系列方法[8],这些方法各有优点和问题。与其他方法相比,模型试算法思路直观,假设条件少,因而成为常用的方法。但是,该方法最大的问题是计算分析时无法确定不同污染源对环境容量的影响大小。对于无环境容量需要减排的海湾,从哪个污染源开始减排,多个污染源之间如何形成减排量组合方案,常常无从下手,即使采用分区等多方案计算仍然难以得到优化方案,污染源数量较多时,问题则更加严重[9-10]

    本质上,海湾环境容量以“场”的方式存在,受到自然条件和社会选择的双重影响。不同海洋功能区选择不同的水质目标体现出社会选择,污染源的数量和位置、污染物的种类和排放量、所在海域的地形和水动力条件等属于自然因素。在海湾水质目标约束下,污染物输运扩散与多种自然因素相互作用,构成了污染排放与海域环境容量之间复杂的非线性关系。

    随机森林(random forest,RF)算法是Breiman于2001年提出的一种集成的机器学习算法,可以进行分类和回归,具有计算精度高、学习过程快、稳定性强等特点[11]。RF算法利用解释变量取值随机化后分类误差变化对解释变量的相对重要性进行评价,误差变化越大,说明解释变量的重要性越大[12]。RF的重要性分析方法在诸多领域得到广泛应用[13-16]

    本文利用RF解释变量重要性分析方法,与常规的水质模型结合,进行污染源对环境容量影响的重要性分析,以期为模型试算法方案设计提供依据,从而降低计算工作量,提高计算效率。本研究以海南省陵水新村潟湖入海污染物总量控制为例进行了方法有效性的验证,研究结果可为其他同类问题研究提供借鉴。

    • 新村潟湖位于海南省陵水县东南部,是一个典型的沙坝−潮汐汊道−潟湖体系,面积约21 km2(包括滩涂),其地理位置和海洋功能区划见图1。海湾通过潮汐汊道与外海联系,口门段长约0.5 km,水深5 m左右,海湾开敞度<0.01,为封闭型海湾[17]。该海域潮差小,湾内最大潮差1.28 m,平均潮差0.98 m,水动力较弱[18]。潟湖北面和西北面有曲沟河及曲港河两条河流注入,流量较小。潟湖周边分布有隆广、文罗、三才、新村、黎安5个乡镇,人口约10万(2015年),产业发展以农业为主(粮食种植、畜牧业、渔业等),工业和服务业欠发达。

      图  1  研究区地理位置及海洋功能区划

      Figure 1.  Location of study area and marine functional zoning

      近乎封闭的海湾环境,加之较弱的水交换能力,导致从陆源和海上污染源进入海湾的污染物输运扩散困难,氮、磷等多种污染物在海湾内累积,新村潟湖水体富营养化问题严重[19]

      据《海南省海洋功能区划(2011-2020年)》,新村潟湖海域分为4个海洋功能区,即新村海草海洋保护区重点区(A06-08-1)、新村海草海洋保护区一般区(A06-08-2)、新村农渔业区养殖区(A1-14-2)和新村农渔业区渔业基础设施区(A1-14-1)。按照环境保护要求,各功能区分别执行一类、二类、二类和不劣于三类海水水质标准。

    • 为配合新村港蓝色海湾综合整治工程,2017年6月对研究海域陆源和海上污染物源进行了调查评估,调查评估过程执行第一次全国污染源普查相关要求[20]。调查评估结果显示,渔排养殖、城镇污水和径流注入是新村潟湖无机氮和活性磷酸盐的3类主要污染源。

      渔排养殖污染呈面状分布,经过合并,简化为29个点源,编号为yp1-yp29;城镇排污合并为9个点源,编号为cz1-cz9;径流注入包括曲港河(qgh1)和曲沟河(qgh2)两个点源以及一个入海排污口(rhk1)。上述3类污染源共计41个,分布见图2。2017年6月调查中的各类污染源的总氮、总磷排放量的统计特征见表1

      图  2  新村潟湖污染源位置

      Figure 2.  Distribution of pollution sources in Xincun lagoon

      污染物种类统计
      特征值/kg
      排污口类型
      渔排
      yp1-yp29
      城镇排污
      cz1-cz9
      径流注入
      TN最大17867.128339.188413.4
      最小1471.6508.95216.6
      平均6371.44826.938214.9
      TP最大2970.72036.115611.8
      最小233.436.6631.4
      平均1019.7346.87740.9

      表 1  2017年6月影响新村潟湖污染源TN、TP排放量的统计数据

      Table 1.  Statistical characteristics of TN and TP emissions from pollution sources in June 2017

    • 新村港蓝色海湾综合整治工程实施单位于2017年对新村港及其邻近海域进行了3个季节的水质监测,布设了25个站位,站位如图3所示。水质监测时间分别为2017年3月18日-3月21日(平水季)、6月30日-7月2日(丰水季)和12月12日-12月14日(枯水季)。监测项目包括:pH、温度、盐度、悬浮物(SS)、溶解氧(DO)、化学需氧量(CODMn)、无机氮、活性磷酸盐、石油类及重金属共18项指标。

      图  3  研究区水质监测站位

      Figure 3.  Water quality monitoring stations in the study area

      对照各功能区水质目标,研究海域各功能区的CODMn均达到管理要求,无机氮和活性磷酸盐呈现不同程度超标,如海草保护区重点区(A06-08-1)执行一类水质标准,无机氮超标率(面积)为57.17%,活性磷酸盐全部超标;新村海草海洋保护区一般区(A06-08-2)和新村农渔业区养殖区(A1-14-2),执行二类水质标准,无机氮超标率(面积)为33.66%,活性磷酸盐达标;新村农渔业区渔业基础设施区(A1-14-1)无机氮超标率(面积)为7%,活性磷酸盐超标率(面积)为48.54%。

      基于上述结果,考虑陆源及海上污染源现状和未来变化情况,选择无机氮和活性磷酸盐作为总量控制指标进行后续研究。

    • 基于环境容量的概念,研究海域可以分为两类:一类,污染物浓度超过相应功能区的水质管理目标,该区域已经没有环境容量;另一类,污染物浓度低于要求的水质目标,仍有剩余环境容量。因而,污染源排放对于海湾环境的影响问题及污染源的重要性排序问题可以转化随机森林的分类问题。

      分类问题需要选择因变量和解释变量。随机森林(RF)算法利用Bootstrap重抽样方法从样本中随机选择部分变量作为决策树节点,每个决策树都是一个分类器,输入样本后,每个决策树产生对应的分类结果,收集分类结果,采用投票方式决定最终分类结果。研究过程中,可以选择信息减损量、信息减损率、基尼系数下降率等作为变量重要度指标。当某解释变量取值随机化后导致RF中的每棵决策树指标值发生变化,取其平均值,平均值越大该变量的相对重要度就越大[21]

    • 该分类问题的因变量为污染物浓度是否满足水质目标的状况。为此,将海湾空间水质浓度值转换为是否满足水质目标的类别数据。定义研究空间坐标为(x, y)处污染物水质指数如式(1):

      式中:$c(x,y)$为总量控制指标的背景浓度值;${c_s}(x,y)$为该位置所在功能区相应污染物的水质目标值。若$C(x,y)$≥1,则该点水质超标,令其类别值为1;反之,若$C(x,y)$<1,则该点水质未超标,令其类别值为0。据此,研究区域所有点分为0和1两类,构成了分类问题的因变量。

    • 针对水质控制指标,如前文所述,污染源对环境容量的影响受到多种因素的制约,为此,需要构建能够综合表述这些因素影响的变量。本文以污染源的响应系数作为表达污染源位置、所在海域地形和水动力条件等因素的综合影响因子,并将每一个污染源的响应系数与其排放量的乘积作为解释变量。

      每一个污染源的排放量由污染源调查评估得到,而污染源的响应系数利用Mike21软件构建二维水质模型计算得到。在进行响应系数计算时,需要进行水动力模型验证和水质模型验证,使响应系数计算结果满足精度要求[22]

      需要指出的是,污染源调查和评估得到的是陆源和海上污染源的TN和TP排放值,但《海水水质标准(GB 3097-1997)》中未列出两者的水质标准,因此,需要通过合理的方式确定TN、TP与海水水质无机氮、活性磷酸盐的换算关系,继而得到无机氮、活性磷酸盐的排放值。由于罗源湾的水动力条件、污染源种类及排放特征与新村潟湖较为接近,通过类比分析并咨询多位领域专家意见确定,罗源湾相应的换算系数可以引入本文的计算研究[9,23]

    • 进行RF分类计算时,需要进行研究区域空间剖分,网格的尺寸取决于研究区域的大小以及研究问题的精度要求,可以比较多种尺度的网格精度后确定。每一个网格上有一个因变量值(0或1)和一组解释变量值。m个污染源在该网格上的响应系数与对应的污染源排放值相乘,得到m个解释变量。如果研究区域分成k个网格,则构成k个(解释变量—因变量)样本。变量重要性具体计算步骤如下[24]

      (1)首先对样本进行随机筛选,分成训练集和测试集,从训练集中选择部分样本(一般为2/3左右)建立决策树,余下样本则为测试集。

      (2)重复上述过程多次,由多棵决策树共同构成随机森林。

      (3)每个决策树分类结果通过投票决定。由于训练集构造方式不同,分类模型之间存在较大差异,因而模型具有较强的泛化能力。测试集用于验证分类准确率。

      (4)面对随机森林的分类问题,通常采用袋外错误率(out-of-bag error rate)或不纯度(impurity)作为估计变量重要性的规则。由于随机森林分类算法进行节点分割时,Gini指数(纯度)可以更直接地衡量特征分割的效果,因此,本文选取平均基尼系数下降率(mean decrease Gini, MDG)作为重要度排序指标[25]

      解释变量较多时,序列后向搜索法可以选出影响较大解释变量,即每次去掉一个重要度最小的变量,计算分类正确率,最终得到解释变量个数最少、分类正确率最高的集合作为最优特征子集[26]。为了保证结果的准确性和稳定性,选用10次十折交叉验证法取平均值。

    • 考虑到研究区域范围、水质监测站位数量及计算效率,通过比较确定网格尺寸为100 m×100 m,研究区域划分为1743个网格。利用Arcgis 10.6对25个水质监测站位无机氮和活性磷酸盐实测数据进行Kriging插值,将平水季、丰水季及枯水季3季平均值作为污染物背景值。

      根据研究区域海域水文实测资料对Mike21构建的二维水动力和水质模型进行潮流和潮位验证。结果显示,潮位验证结果良好,高、低潮时的相位偏差小于0.5 h,潮位平均绝对误差小于10 cm;潮流流速过程线形态基本一致,流速验证结果较好,且平均流向偏差小于10°。总体而言,所建立的新村潟湖二维潮流数学模型计算结果较为合理,可以作为后续水质模拟计算分析的基础。

      在水动力模拟的基础上,利用Mike 21二维水动力和水质模块完成41个污染源的浓度响应场计算。考虑到篇幅,现列出曲港河和曲沟河污染源的响应场,如图4所示。

      图  4  径流污染的响应场

      Figure 4.  Response field of unit source

      通过Arcgis获取网格中心点所在位置的污染物浓度背景值和每一个污染源的响应系数值,利用公式(1)得到每一个网格的分类问题的因变量值;经过转换污染源强与响应系数的乘积得到解释变量,如此构成1743个方程进行RF分类分析。研究区域无机氮和活性磷酸盐背景浓度场超标情况见图5

      图  5  研究区域无机氮和活性磷酸盐超标情况(红色为超标区域,绿色为未超标区域)

      Figure 5.  Over standard of inorganic nitrogen and phosphate in the study area(red is the area exceeding the standard, and green is the area not exceeding the standard)

      本文使用Matlab 2016b代码(Windows-pre- compiled-RF_mexstandalone-v0.02,mex/standalone interface to Andy Liaw et al.’s C code,added by abhishek jaiantilal,Version: 0.02)进行随机森林分类及序列后向搜索法解释变量重要性计算。图6为无机氮和活性磷酸盐对应分类精度和污染源数量的关系。经过筛选,从分类精度角度,无机氮和活性磷酸盐分别选择16个和25个污染源作为最优特征子集。采用最优特征子集进行计算能有效提升模型的运算效率,使分类结果更加接近真实的类别分布。从图6可知,RF的分类准确性较高,超过90%。序列后向搜索的开始阶段,随着污染源数量的减少,分类准确率为94%~96%;当污染源减少至10个以下,分类准确呈直线下降。也就是说,无论是无机氮还是活性磷酸盐,筛选后剩下的10个污染源,对研究区域的水质存在全局性影响,其他污染源则影响较小,或者只是影响到局部区域,因此,采用模型试算法计算环境容量时,从提高计算效率的角度,可以重点关注这些污染源。

      图  6  分类精度与污染源数量的关系

      Figure 6.  Relationship between classification accuracy and quantity of pollution sources

      无机氮污染的污染源基尼系数下降率(MDG)见表2。从表2可知,进入无机氮计算分析最优特征子集的16个污染源中,渔排养殖污染源占13个,占比达到80%以上,且重要度排名前5的污染源中有4个是渔排养殖。从前文可以看出,渔排养殖污染源为29个,占海湾主要污染源数量(41个)的70%以上,因此,渔排养殖是影响海湾无机氮环境容量的主要原因。其次,径流注入引起的无机氮污染中,曲港河(qgh1)和曲沟河(qgh2)均进入最优特征子集。城镇污水的排放量较少,而且大部分排放口靠近水交换能力较强的口门处,无机氮运输扩散过程中滞留时间较短,因此,除cz9以外,其他城镇排污口均未进入最优特征子集。定性地,cz9排污口位于海草海洋保护区的重点区,执行一类海水水质标准,且该区域水交换能力较差,该污染源进入最优特征子集与直观判断是一致的。

      污染源编号MDG污染源编号MDG污染源编号MDG污染源编号MDG
      yp21 44.21 yp19 36.82 yp3 29.09 yp23 27.40
      yp20 42.77 qgh2 33.59 yp22 28.88 yp25 26.50
      cz9 40.75 yp18 33.03 yp4 28.58 yp10 25.51
      yp8 38.20 qgh1 31.28 yp17 28.13 yp9 24.83

      表 2  无机氮污染源影响排序

      Table 2.  Impact ranking of inorganic nitrogen pollution sources

      活性磷酸盐污染源的基尼系数下降率(MDG)见表3。从表3可知,活性磷酸盐污染源重要度排序与无机氮差异较大。由图5可知,活性磷酸盐超标面积大于无机氮,超标的区域集中在近岸区域,这表明活性磷酸盐在近岸区域已无环境容量或者剩余环境容量很小,从而使得位于口门和湾底部附近的城镇污水排放口重要度增加。与无机氮相比,活性磷酸盐在径流注入排污口附近海域超标面积增加,因而这些排污口的重要度增加。

      污染源编号MDG污染源编号MDG污染源编号MDG污染源编号MDG污染源编号MDG
      cz763.71yp131.59yp2623.33yp917.77yp1816.24
      qgh247.57yp330.78yp2721.89yp817.30yp416.18
      yp1644.99yp2930.50cz919.81cz417.25yp1315.83
      qgh137.40yp2825.58rhk118.23yp616.63cz814.88
      yp231.81yp525.01yp2117.92yp1916.33yp1214.60

      表 3  活性磷酸盐污染源影响排序

      Table 3.  Impact ranking of phosphorus pollution sources

      另外,从无机氮和活性磷酸盐污染源重要度排序结果可以看出,污染源重要度和污染源排放量没有明显的相关性,相反,与污染源所在位置的水交换能力、水质超标情况的相关性较大。

    • 为了进一步验证重要度排序的可靠性,采用Mike 21构建的二维水质模型分别计算曲港河(qgh1)和曲沟河(qgh2)活性磷酸盐减排对研究区水质变化的影响。减排量采用30%,50%和70% 3种方案,减排后水质达标增加的面积见图7

      图  7  曲港河和曲沟河活性磷酸盐减排后达标面积的变化

      Figure 7.  Area increase meeting water quality requirements of phosphate in Qugang river and Qugou river after emission reduction

      图7可以看出,在减排相同比例的情况下,曲沟河(qgh2)减排后满足水质目标的面积对比初始值有更大的增加,说明曲沟河(qgh2)减排效果好于曲港河(qgh1),这个结论与表3的重要度排序一致。限于篇幅,其他验证结果未在文中展示。

    • (1)入海污染源排放与海域环境容量之间存在复杂的非线性关系,将随机森林(RF)与常规水质模型结合进行污染源重要性排序,可以为减排方案设计提供方向,有利于提高计算效率。

      (2)影响新村潟湖的污染源众多,在水质目标约束下,无论是无机氮还是活性磷酸盐,41个污染源中有10个污染源对环境容量存在全局性影响,其他污染源则影响较小或只是局部影响。渔排养殖是影响新村潟湖无机氮环境容量的主要因素,径流注入的影响其次。对活性磷酸盐而言,3类污染源的影响程度差异不大。

      (3)海湾入海污染物总量控制除了受到水质目标约束,尚受到其他诸多因素的影响。本研究只从环境容量与污染源的非线性关系视角进行了研究,在此基础上,如何结合社会、经济和技术因素进行减排方案设计,是未来进一步研究的方向。

参考文献 (26)

目录

    /

    返回文章