南科大郑一课题组发表可解释人工智能跨区域仿真河流氮通量动态的研究成果

2022-07-11

近日,南方科技大学环境科学与工程学院教授郑一课题组在Environmental Science & Technology发表可解释人工智能跨区域仿真河流氮通量动态的研究成果。

051657002950654694.jpg

人类活动导致的河流氮通量(nitrogen flux)增加对沿海地区水安全和海洋生态安全构成威胁,全球河流氮通量的调控是避免地球系统演化突破“行星边界”(planetary boundaries)的关键任务之一。受监测手段及其成本所限,河流营养盐含量的高频(如逐日)监测仅在少数地区实现;而不同区域建立的机理模型或经验模型还无法实现跨区域的准确预测。因此,现有观测数据和模拟技术尚难以勾勒出河流氮通量日尺度动态的全球图景。

以深度学习(deep learning)为代表的新一代人工智能(AI)技术已在水文模拟中获得成功,并开始被用于水环境模拟。现有研究通常利用不同水质变量的相关性,或单一水质变量的自相关和空间相关性进行预测,不考虑水文气象、人类活动等驱动力机制和流域属性特征;而深度学习的黑箱本质(black-box nature)也使其面临可解释性的疑问。因此,深度学习在水环境模拟中的潜力尚有待证实和发掘。

本研究利用福建省九龙江流域长时间序列营养盐逐日观测数据,进行河流无机氮(DIN)浓度和通量的深度学习建模(图1)。模型采用Long short-term memory (LSTM)框架,以水文气象和污染源(化肥施用和畜禽养殖排放)数据为驱动,用九龙江主要支流北江的数据训练,精准预测了北江逐日DIN浓度和通量(纳什系数最高可分别达到0.67和0.92),其精度远超现有机理模型可达的程度。训练后的LSTM模型能合理体现流域过程,具有可解释性,而这一可解释性与LSTM的数学构架有关。

1.jpg

图1. 基于LSTM的深度学习模型预测九龙江入海DIN的日均浓度和通量。

研究进一步测试了北江DIN通量模型的迁移学习(transfer learning)能力,在未经重新训练的情况下直接移用于亚洲、欧洲和北美洲7个自然和社会经济条件迥异的流域(图2)。除在美国Newport Bay流域表现稍差(平均纳什系数为0.32),北江DIN通量模型在其他6个流域的平均纳什系数在0.55-0.84的范围。可见,尽管不同流域差异显著,河流DIN输出的动态规律却存在显著的跨流域一致性(interbasin consistency)。通过深入分析,发现这种一致性主要源自于降雨径流关系:流域之间的降雨径流关系越相似,跨区域预测的效果更佳。这一重要发现表明,利用深度学习AI,有望在现有数据条件下描绘出河流氮通量日动态的全球图景。为展示这一可能性,研究进行了多流域集合训练的测试,利用包括北江在内的7个流域数据训练LSTM通量模型,将美国Newport Bay流域DIN预测的平均纳什系数从0.32提高到了0.68。

2.jpg

图2. 北江DIN通量LSTM模型在全球范围的迁移学习

这项研究成果展示了可解释深度学习AI用于水环境研究的巨大潜力和广阔前景,给出了准确量化全球河流氮通量的新路线图,对于全球水资源与水环境管理具有重要参考价值。

南方科技大学与和香港科技大学联合培养博士生熊睿为论文第一作者,郑一为通讯作者。南科大是论文第一作者。合作者包括香港科技大学副教授陆萌茜(合作导师)、厦门大学教授陈能汪、南方科技大学教授郑焰等。该成果得到了国家自然科学基金和深圳科创委的资助。


论文链接:https://pubs.acs.org/doi/10.1021/acs.est.2c02232