留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于LightGBM算法的大气可降水量预测方法研究

卢厚贤 李锴 李黎 何琦敏 余航 董州楠

卢厚贤, 李锴, 李黎, 何琦敏, 余航, 董州楠. 基于LightGBM算法的大气可降水量预测方法研究[J]. 全球定位系统. doi: 10.12265/j.gnss.2024079
引用本文: 卢厚贤, 李锴, 李黎, 何琦敏, 余航, 董州楠. 基于LightGBM算法的大气可降水量预测方法研究[J]. 全球定位系统. doi: 10.12265/j.gnss.2024079
LU Houxian, LI Kai, LI Li, HE Qimin, YU Hang, DONG Zhounan. Research on precipitable water vapor prediction method based on lightGBM algorithm[J]. GNSS World of China. doi: 10.12265/j.gnss.2024079
Citation: LU Houxian, LI Kai, LI Li, HE Qimin, YU Hang, DONG Zhounan. Research on precipitable water vapor prediction method based on lightGBM algorithm[J]. GNSS World of China. doi: 10.12265/j.gnss.2024079

基于LightGBM算法的大气可降水量预测方法研究

doi: 10.12265/j.gnss.2024079
基金项目: 江苏省高等学校大学生创新创业训练计划重点项目(202310332118Y,202410332122Y);江苏省研究生实践创新项目(SJCX24_1901,SJCX23_1718 );江苏省科技计划项目(BK20230660);国家自然科学基金项目(42204014)
详细信息
    作者简介:

    卢厚贤:(2002—),男,主要研究方向为GNSS气象学. E-mail: luhouxian@post.usts.edu.cn

    李锴:(1997—),男,硕士研究生,主要从事GNSS气象学方面研究. E-mail:2213021026@post.usts.edu.cn

    李黎:(1981—),男,博士,副教授,主要从事GNSS精密定位及GNSS气象学方面研究. E-mail:gszl.lili@usts.edu.cn

    通信作者:

    李 黎E-mail:gszl.lili@gmail.com

  • 中图分类号: P228.4;P426

Research on precipitable water vapor prediction method based on lightGBM algorithm

  • 摘要: 大气可降水量(precipitable water vapor,PWV)为单位横截面积垂直气柱内地面至对流层顶部的液态水汽含量,可反映大气中的水汽浓度. 本文首先利用2014—2019年长三角地区7个探空站资料,分析了PWV与对流层天顶总延迟(zenith tropospheric delay,ZTD)、天顶静力学延迟(zenith hydrostatic delay,ZHD)、对流层湿延迟(zenith wet delay, ZWD)、水汽压(Es)、大气压(Ps)、地面温度(Ts)、加权平均温度(Tm)之间的相关性,再基于梯度提升机(light gradient boosting machine,LightGBM)构建了一套适用于长三角地区的PWV预测模型,并分析了LightGBM-PWV模型的预测精度. 结果表明,PWV与TmTsPsEs、ZHD、ZWD和ZTD之间的相关系数(R)分别为0.74、0.76、–0.59、0.76、–0.43、1.00和0.94;全年、分季度和分月LightGBM-PWV模型的平均偏差分别为0.10 mm、0.11 mm和0.12 mm,均方根误差(root mean square error,RMSE)分别为0.25 mm、0.26 mm和0.31 mm,模型精度依次递减,异于传统线性拟合PWV模型;全年LightGBM-PWV预测模型精度最高,可用于长三角地区的GNSS-PWV预测、分析和研究.

     

  • 图  1  长三角区域探空站分布图

    图  2  PWV、TmTsPsEs、ZHD、ZWD和ZTD间的相关系数

    图  3  安庆、阜阳、杭州和南京探空站的全年LightGBM-PWV时序变化及其偏差

    图  4  分季度LightGBM-PWV模型精度分析

    图  5  分月LightGBM-PWV模型的精度分析

    表  1  长三角地区探空站位置信息

    地区站点号坐标(纬度,经度)高程/m
    杭州58457(30.23°N,120.16°E)43.00
    衢州58633(28.96°N,118.86°E)71.00
    上海58362(31.40°N,121.46°E)4.00
    安庆58424(30.53°N,117.05°E)20.00
    阜阳58203(32.86°N,115.73°E)33.00
    南京58238(32.00°N,118.80°E)7.00
    射阳58150(33.76°N,120.25°E)7.00
    下载: 导出CSV

    表  2  PWV与TmTsPsEs、ZHD、ZWD和ZTD之间的相关系数

    因变量自变量R自变量自变量R自变量自变量R自变量自变量R
    PWVTs0.76TsPs–0.60PsTm–0.65EsZTD0.66
    PWVPs–0.59TsEs1.00PsZHD0.74TmZHD–0.49
    PWVEs0.76TsTm0.94PsZWD–0.58TmZWD0.73
    PWVTm0.74TsZHD–0.46PsZTD–0.37TmZTD0.62
    PWVZHD–0.43TsZWD0.75EsTm0.93ZHDZWD–0.40
    PWVZTD0.94TsZTD0.66EsZHD–0.43ZHDZTD–0.09
    PWVZWD1.00PsEs–0.58EsZWD0.75ZWDZTD0.95
    下载: 导出CSV

    表  3  PWV、TmTsPsEs、ZHD、ZWD和ZTD之间的容忍度

    自变量自变量Tol自变量自变量Tol自变量自变量Tol
    TsTm0.68TmEs0.68PsZTD0.69
    TsPs0.79TmZWD0.45EsZWD0.42
    TsEs0.67TmZHD0.90EsZHD0.89
    TsZWD0.42TmZTD0.52EsZTD0.49
    TsZHD0.89PsEs0.79ZTDZWD0.12
    TsZTD0.49PsZWD0.65ZTDZHD0.84
    TmPs0.68PsZHD0.94ZWDZHD0.82
    下载: 导出CSV

    表  4  2014—2018年验证集的交叉验证精度对比表 mm

    探空站KRMSEBias
    南京50.190.10
    100.190.09
    150.180.09
    杭州50.200.10
    100.180.09
    150.180.09
    安庆50.270.11
    100.260.10
    150.260.10
    阜阳50.390.12
    100.390.12
    150.390.12
    衢州50.290.12
    100.290.11
    150.290.11
    上海50.240.09
    100.240.09
    150.240.09
    射阳50.250.10
    100.240.10
    150.240.10
    50.260.11
    均值100.260.10
    150.250.10
    下载: 导出CSV

    表  5  最大深度、叶子节点数、迭代次数和学习率的最优参数可选值

    参数最大深度叶子节点数迭代次数学习率
    可选值10、30、50、70、90、1105、10、15、30、45、60、75700、800、900、1 0000.03、0.05、0.10
    下载: 导出CSV

    表  6  2019年LightGBM-PWV模型精度统计表 mm

    探空站安庆阜阳杭州南京衢州上海射阳均值
    Bias0.100.120.090.090.110.090.100.10
    RMSE0.260.390.180.180.290.240.240.25
    下载: 导出CSV

    表  7  全年、分季度和分月LightGBM-PWV模型与PWV线性模型的精度统计表 mm

    时间 LightGBM-PWV模型 PWV线性模型[24-25]
    Bias RMSE Bias RMSE
    全年 0.10 0.25 1.92 2.15
    分季度 0.11 0.26 1.81 2.16
    分月 0.12 0.31 1.72 2.07
    下载: 导出CSV
  • [1] ZHAO Q, LIU Y, YAO W, et al. Hourly rainfall forecast model using supervised learning algorithm[J]. IEEE transactions on geoscience and remote sensing, 2021, 60: 1-9.
    [2] 陈祥明, 王宝宝, 李若瑜, 等. 不同加权平均温度模型对大气可降水量影响分析[J]. 全球定位系统, 2023, 48(3): 72-76. DOI: 10.12265/j.gnss.2023016
    [3] BALDYSZ Z, NYKIEL G. Improved empirical coefficients for estimating water vapor weighted mean temperature over europe for GNSS applications[J]. Remote sensing, 2019, 11(17): 1995. DOI: 10.3390/rs11171995
    [4] 刘晨, 郑南山, 张玉振. 多因子加权平均温度模型研究[J]. 中国科技论文, 2018, 13(15): 1743-1748. DOI: 10.3969/j.issn.2095-2783.2018.15.009
    [5] BEVIS M, BUSINGER S, HERRING T A, et al. GPS meteorology: Remote sensing of atmospheric water vapor using the global positioning system[J]. Journal of geophysical research: atmospheres, 1992, 97(D14): 15787-801. DOI: 10.1029/92JD01517
    [6] 杨鹏飞, 赵庆志, 苏静,等. 黄土高原地区 PWV 影响因素分析及精度评定[J]. 武汉大学学报 (信息科学版), 2022, 47(9): 1470-1478.
    [7] 韦云, 王迅, 王浩, 等. 中国东南沿海地区PWV直接转换模型研究[J]. 大地测量与地球动力学, 2022, 42(7): 750-754.
    [8] 易正晖, 王帅民, 王勇, 等. GNSS对流层延迟推算可降水量的季节转换模型研究[J]. 大地测量与地球动力学, 2017, 37(8): 830-834.
    [9] 李黎, 宋越, 易金花, 等. 对流层延迟与可降水量直接转换模型研究[J]. 大地测量与地球动力学, 2019, 39(5): 492-495, 501.
    [10] UMAKANTH N, SATYANARAYANA G C, SIMON B, et al. Long-term analysis of thunderstorm-related parameters over Visakhapatnam and Machilipatnam, India[J]. Acta geophysica, 2020(68): 921-32. DOI: 10.1007/s11600-020-00431-2
    [11] CAI M, LI J, LIU L, et al. Weighted mean temperature hybrid models in China based on artificial neural network methods[J]. Remote sensing, 2022, 14(15): 3762. DOI: 10.3390/rs14153762
    [12] JU Y, SUN G, CHEN Q, et al. A model combining convolutional neural network and LightGBM algorithm for ultra-short-term wind power forecasting[J]. IEEE access, 2019(7): 28309-28318. DOI: 10.1109/ACCESS.2019.2901920
    [13] LI K, LI L, HU A, et al. Research on modeling weighted average temperature based on the machine learning algorithms[J]. Atmosphere, 2023, 14(8): 1251. DOI: 10.3390/atmos14081251
    [14] SABER M, BOULMAIZ T, GUERMOUI M, et al. Examining lightGBM and CatBoost models for wadi flash flood susceptibility prediction[J]. Geocarto international, 2022, 37(25): 7462-7487. DOI: 10.1080/10106049.2021.1974959
    [15] 池钦, 赵兴旺, 陈健. 几种典型机器学习算法在短临降雨预报分析研究[J]. 全球定位系统, 2022, 47(4): 122-128. DOI: 10.12265/j.gnss.2022039
    [16] MARWITZ J D, DAWSON P J. Department of atmospheric science university of wyoming[C]//The International Symposium on the Qinghai-Xizang Plateau and Mountain Meteorology, F, 2015.
    [17] YANG L, SHAMI A. A lightweight concept drift detection and adaptation framework for IoT data streams[J]. IEEE internet of things magazine, 2021, 4(2): 96-101. DOI: 10.1109/IOTM.0001.2100012
    [18] JIANG P, YE S, LU Y, et al. Development of time-varying global gridded T s–T m model for precise GPS–PWV retrieval[J]. Atmospheric measurement techniques, 2019, 12(2): 1233-1249. DOI: 10.5194/amt-12-1233-2019
    [19] YAO Y, ZHANG B, XU C, et al. Improved one/multi-parameter models that consider seasonal and geographic variations for estimating weighted mean temperature in ground-based GPS meteorology[J]. Journal of geodesy, 2014, 88: 273-82. DOI: 10.1007/s00190-013-0684-6
    [20] YU Z, QU Y, WANG Y, et al. Application of machine-learning-based fusion model in visibility forecast: a case study of Shanghai, China[J]. Remote sensing, 2021, 13(11): 2096. DOI: 10.3390/rs13112096
    [21] CHEN S. K-nearest neighbor algorithm optimization in text categorization[C]//The IOP Conference Series: Earth and EnvironMental Science, F, 2018.
    [22] YONG Z, YOUWEN L, SHIXIONG X. An improved KNN text classification algorithm based on clustering[J]. Journal of computers, 2009, 4(3): 230-237.
    [23] LIU H, XIAO Q, JIAO Z, et al. LightGBM-based prediction of remaining useful life for electric vehicle battery under driving conditions [C]//The 2020 IEEE Sustainable Power and Energy Conference (iSPEC), 2020.
    [24] 范頔, 李黎, 刘彦, 等. 长三角地区GNSS可降水量直接转换模型研究[J]. 大地测量与地球动力学, 2021, 41(6): 628-632.
    [25] 刘彦, 李黎, 韦晔, 等. 利用CORS站研究多因子分季节可降水量转换模型[J]. 测绘科学, 2021, 46(7): 31-37.
  • 加载中
图(5) / 表(7)
计量
  • 文章访问数:  25
  • HTML全文浏览量:  10
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-04-22
  • 录用日期:  2024-04-22
  • 网络出版日期:  2024-11-07

目录

    /

    返回文章
    返回