桂林理工大学测绘地理信息学院黎峻宇:基于多源数据和广义回归神经网络的ZWD预报模型 |《测绘学报》2023年52卷第9期
chanong
|本文内容基于《测绘学报》 2023年第9期(授权号GS京(2023)1783)。
基于多源数据和广义回归神经网络的ZWD预测模型
李俊宇1,2、姚一兵3、刘立龙1,2、张宝3、黄良科1,2、曹丽英3
1. 桂林科技大学测绘与地理信息学院, 桂林, 541006; 2. 广西空间信息测绘重点实验室, 桂林, 541006; 3. 武汉大学测绘学院, 湖北武汉430079省
资助项目:广西壮族自治区科技规划项目(2020GXNSFBA297145;桂科AD23026177);国家自然科学基金项目(42064002;42074035);广西壮族自治区空间信息重点实验室及测绘地图基金(21-238-21-05) );桂林大学科技科学研究启动基金(GUTQDJJ6616032)
摘要: 对流层湿度延迟是GNSS误差源中较难纠正的部分。主流的天顶湿延迟(ZWD)经验模型大多基于单源数据,如测深数据或再分析数据,通过预设的模型函数表示不同尺度下ZWD的变化,可以准确测量变化。由于ZWD尺度在不同尺度上的非线性和复杂变化,需要进一步提高精度。针对这一问题,基于多源数据和具有强大非线性逼近能力的广义回归神经网络(GRNN)构建了ZWD预测模型。首先,我们使用GRNN模型对来自两个不同数据源的网格化ZWD进行优化和下采样,并将其与测深ZWD相结合以获得高质量的ZWD数据集。然后根据ZWD、空间和时间的特点以及机器学**模型的特点,设计GRNN学**模型的输入变量和输出变量,最后采用后优化方法确定模型参数。得到最佳预测模型。 ZWD测深验证显示,与采用相同方法的国际模型经验模型GPT2w相比,模型精度提高了25.3%(RMS),与使用相同方法的单源(探空仪)数据模型相比,精度提高了11.1%。 %;模型的预测精度具有良好的时空稳定性。此外,计算效率和PPP应用的测试结果表明,该模型的计算效率能够满足GNSS实时应用的需求,并且应用于PPP时的改进效果优于GPT2w。本文提出的方法无需使用预设的模型函数即可获得较高的ZWD预测精度,为ZWD建模提供了一种思路。
关键词:对流层水汽延迟,多源数据,GRNN,非线性近似,预测
引用格式:李俊宇, 姚一斌, 刘立龙, 等, 基于多源数据和广义回归神经网络的ZWD预测模型[J]. 测绘学报, 2023, 52(9): 1492-1503 。 DOI: 10.11947/j.AGCS.2023.20220084
李俊宇, 姚一斌, 刘立龙, 等, 基于多源数据和广义回归神经网络的ZWD预测模型[J], 测绘学报, 2023, 52(9): 1492-1503. DOI: 10.11947 /j.AGCS.2023.20220084
阅读全文:http://xb.chinasmp.com/article/2023/1001-1595/20230907.htm
介绍
GNSS信号经过对流层时产生的延迟(对流层延迟)是GNSS导航定位的主要误差源之一。信号传播路径上的对流层延迟很难准确测量,必须进行建模。一种常见的方法是确定天顶对流层延迟(ZTD) 并将其乘以投影函数以获得倾斜路径的对流层延迟。事实证明,准确地模拟ZTD 是削弱对流层延迟影响的一项重要任务。根据影响因素不同,ZTD可分为天顶对流层静态延迟(ZHD)和天顶对流层湿延迟(ZWD)。其中,ZHD约占ZTD的90%,可以根据实测气象数据和经验模型以毫米级精度进行精确计算[1]。水汽等引起的ZWD是由水汽快速时空变化引起的,其变化率可达ZHD的4倍[2-3],难以准确计算,成为制约因素。主要因素。 GNSS 对流层校正。此外,高精度ZWD先验值提高了GNSS高精度单点定位的收敛速度,优化了坐标高程分量的精度[4-5]。因此,建立高精度的ZWD预测模型具有重要的实际意义。学者们在ZWD建模方面做出了很大的努力,建立的模型主要分为基于实测气象参数的模型和经验模型。前者如Hopfield模型[6]和Saastamoinen模型[1],依赖实测温度、相对湿度、气压等气象数据,修正精度可达到厘米级。后者只需要站点坐标和时间作为基本输入信息,在实际工作中应用更为广泛,特别是在GNSS实时应用中。文献[7-8]根据从美国标准大气数据中提取的气象参数的年平均和年周期振幅网格表,建立了一系列UNB模型。该系列模型基于三角函数计算ZWD,考虑了15度纬度网格表和气象参数的年度变化,UNB3m模型的平均精度为5.5 cm[9]。文献[10-12]利用国家环境预报中心的天气再分析数据,构建了基于三角函数、考虑天气年变化和日变化的11TropGrid系列模型。参数或ZWD。文献[13]利用欧洲中尺度天气预报中心ERA中期气象再分析数据,根据年函数和半年函数估算出55和11气象参数,并进行定期拟合。全球网格模型GPT2w已经建立。 GPT2w是目前国际上公认的ZWD计算精度最高的模型[14-16]。此外,学者们基于类似的方法建立了几个类似的模型[17-19]。
从前人的研究中可以看出,目前主流的经验模型大多基于再分析数据等单源数据,并采用代表不同尺度下ZWD变化的模型函数,因此是非线性的,难以反映复杂的影响。不同尺度下ZWD的变化。机器学**算法是自动分析数据获得模式并利用发现的模式来预测未知数据、当前模式尚不清楚的复杂非线性问题的算法,在处理时具有很大的优势[20-21]。文献[22]建立了利用反向传播神经网络(BPNN)对Hopfield估计ZTD误差进行补偿的模型,补偿模型的均方根误差优化了90%以上。在文献[21]中,我们基于BPNN建立了对流层参数的加权平均温度模型,该模型的性能相比两个更准确的经验模型有了显着的提升,再次证明了机器学**算法在建模上的优越性。广义回归神经网络(GRNN)基于非线性回归理论进行函数估计,并根据最大概率原理计算网络输出向量。与传统的神经网络相比,GRNN的学**过程更加方便,特别适合解决曲线拟合问题,广泛应用于各个领域和工程领域。考虑到ZWD剧烈的时空变化,本文构建了基于多源数据和GRNN的高精度ZWD预测模型,并测试了模型的准确性。
1 研究领域及数据来源
1.1 研究范围
本文选择北纬15至55、东经70至135之间的区域进行研究。该地区覆盖中国大陆及周边国家和地区,地形复杂,气候模式多样,陆海相互作用强烈,导致ZWD时空变化剧烈[23]。因此,该地区可能是研究高精度ZWD预测模型的理想试验场,但由于自然条件复杂,高精度模型的构建也带来了诸多挑战。另外,该地区北斗/GNSS实时用户较多,如果能为他们提供高精度的ZWD预测,将对提高北斗/GNSS实时精度起到积极作用。 -中国及周边地区的时间应用。
1.2 数据来源
本文使用的数据包括中国气象局新一代中尺度版全球/区域同化预报系统(GRAPES_MESO)数据、ECMWF第五代再分析数据(ERA5)和全球无线电探空仪综合档案(IGRA)。 GRAPES_MESO水平分辨率为0.10.1,垂直分辨率为1000 hPa~100 hPa,共8层,时间分辨率为3 h。 ZWD(记为GRAPES ZWD)是利用研究区2016年和2017年所有GRAPES_MESO网格点的温度、水汽压和地质势高度垂直剖面预测数据存档数据计算得出。
(1)
(2)
其中Nw代表湿折射率,k2=64.79 K/hPa,k3=377 600 K2/hPa,e为水蒸气压(hPa),T为温度(K)[24]。
ERA5数据的时间分辨率为1小时,空间分辨率为0.250.25。采用1000hPa至1hPa的37个大气压层数据计算ZWD(记为ERA5 ZWD),计算方法与GRAPES ZWD相同。由于ERA5压力分层数据不能直接提供水蒸气压,因此我们采用参考文献[25]中的方法根据温度和相对湿度计算水蒸气压。
无线电探空仪可以测量各种大气参数,是大气研究的重要工具。相对湿度和温度的测量精度分别达到3%和0.2 K[26]。测深数据由于其高精度和可靠性而经常被用来评估模型精度[14, 19]。因此,利用IGRA提供的2016年和2017年146个站点的数据计算ZWD,记录为RS ZWD,并用于建模和验证。时间分辨率为12 h,方法同前。请注意,在使用RS ZWD 进行验证之前,必须将GRAPES/ERA5 ZWD 插值到探测站位置。我们首先利用已知精度最高的ZWD高程修正方法[14]将探空站附近4个网格点的ZWD修正为探空站的高度,然后利用双线性水平插值法得到探空站的位置。探测站。一个响铃的电台。图1显示了网格GRAPES/ERA5 ZWD的覆盖范围和探空站的位置分布。这里,三角形代表参与建模的探测站,圆点代表正在确认的探测站。
图1 网格GRAPES/ERA5 ZWD覆盖范围及探空站位置分布
图1 网格GRAPES/ERA5 ZWD覆盖区域及探空站分布
图表选项
2 基于多源数据和GRNN的ZWD预测模型
大多数现有的ZWD 模型都基于单一数据源,例如再分析数据、数值天气预报数据或测深数据。基于前两类数据的模型具有较高的时空分辨率(可达0.10.1,1小时)。较为强烈的地区如我国青藏高原,海拔波动较大,天气多变[27]。基于后者的单站模型精度较高,但探测站的水平分辨率约为250公里,因此模型覆盖范围较窄,时间分辨率一般只有12小时。本文利用两个数据源,提出了一种基于多源数据构建ZWD 预测模型的方法。 GRNN是一种前向传播神经网络,不需要反向传播来获取模型参数,学**速度快,不需要迭代处理[28]。这些优点使GRNN 成为处理回归、近似、拟合和预测问题的强大工具。在本文中,我们利用GRNN的这些优点,构建了基于GRNN的ZWD预测模型。
2.1 GRNN模型
GRNN的理论基础是非线性回归分析。在GRNN中,如果有一个随机变量x和一个因变量y,其概率密度函数为f(x,y),x的观测样本为X,则y的条件期望值为Masu。
(3)
根据x和y的观测样本,通过非参数估计得到未知的概率密度函数f(x,y)。假设(X,Y)是基于x和y的观测样本对X和Y的概率密度函数估计,则
(四)
式中,n表示样本数,p表示随机变量x的维数。 是模型的超参数,也称为平滑系数,是GRNN唯一的未知参数。通过合理调整,GRNN网络可以获得更好的结果,但在本文中,我们使用后优化技术来确定性能。 Xi和Yi分别表示随机变量x和y的观测值。概率估计(X, Y) 的物理解释是:将宽度为的样本概率分配给每个样本Xi和Yi,概率估计是这些样本概率的总和[29]。令Di 为X 和Xi 之间的欧氏距离,我们得到:
(五)
此时,高斯核可以表示为:
(6)
对方程(3) 积分可得:
(7)
这意味着GRNN只需要确定Di2即可计算最佳估计。
GRNN 由四层组成:输入层、模式层、附加层和输出层。输入层由p 个神经元组成,具有与x 相同的维度,并连接到模式层。模式层有n个神经元,每个神经元对应一个样本向量Xi。对于每个神经元,使用式(5)计算Di2,并将其输入式(6)计算K(X,Xi)。该模式的输出层之一被馈送到求和层进行相加。求和层中有两种不同类型的神经元。一个是分子神经元,另一个是分母神经元。前者计算YiK(X, Xi)之和,后者计算K(X, Xi)之和,两个结果都发送到输出层。输出层只有一个神经元,接收求和层的输出,因此它根据指定的X 进行估计。
2.2 基于GRNN的ZWD预测模型
ZWD 对空间和时间高度敏感[13, 30],经验输入可以提高机器学**模型的性能[21, 28]。在此基础上,构建了基于GRNN的ZWD预测模型(GRNN-F)训练框架,如图2所示。与固定ZWD的预设函数模型的时变特性不同,GRNN网络是数据自适应的。
图2 GRNN-F学**框架
图2 GRNN-F学**框架
图表选项
图2输入层中,lat、lon、h分别为测量站的纬度、经度、海拔,d、hod分别为年累计日数和UTC时间,ZWDGPT2w为GPT2w估计的经验ZWD (GPT2w-ZWD))。输出层是优化和下采样网格ERA5/GRAPES ZWD(参见第2.2.1 节)和RS ZWD 的合并数据集。基于图2框架训练的模型,我们输入3D坐标、时间和GPT2w-ZWD,得到ZWD的预测值,记为GRNN-F-ZWD。
(8)
式中g代表GRNN-F模型。此外,为了突出基于多源数据建模的优势,训练时仅使用参与GRNN-F建模的RS ZWD作为输出,并基于相同的数据建立单源模型。训练框架为GRNN-F,输入变量为ZWD数据预测模型(RS ZWD),称为GRNN-R。将三维坐标、时间、GPT2w-ZWD输入GRNN-R中,得到ZWD的预测值(简称GRNN-R-ZWD),输入与输出的关系表示如下。
(9)
请注意,GPT2w并不直接输出ZWD,用户根据GPT2w输出的气象参数计算ZWD,具体计算公式如下[31]
(十)
式中,k’2和k3为大气折射常数,Tm为大气加权平均温度,Rd为干燥空气气体常数,为水蒸气减少率,g0为标准重力加速度。
2.2.1 数据预处理
Grid ERA5/GRAPES ZWD 在建模前进行了优化,因为高质量的训练样本有助于构建高度准确的GRNN 模型。优化的基本思路是利用GRNN将146个探空站的高质量RS ZWD作为输出,插值到探空站ERA5/GRPES ZWD的网络结构中,计算出探空的3D坐标站。这是关于计算的。我们以测量站和时间为输入并拟合它们的关系,建立以测量站的3D坐标、时间和ERA5/GRAPES ZWD为输入的优化模型,并获得优化的ERA5/GRAPES ZWD作为输出。具体方法和步骤可参见文献[29]。将网格ERA5/GRAPES ZWD 以及相应的3D 坐标和时间输入到优化模型中,以获得优化后的网格ERA5/GRAPES ZWD。以RSZWD为参考值,优化前后ERA5/GRAPES ZWD插值到探空站的精度如表1所示。
表1 优化前后探空站GRAPES/ERA5 ZWD插值精度
表1 校准ZWD 和使用无线电探空仪站点插值的原始GRAPES/ERA5 ZWD 的精度。
唔
表选项
显然,优化后GRAPES/ERA5ZWD的偏差减小到接近0mm,RMS小于3cm。对于ZWD,其基于实测天气数据的估计精度仅为厘米级,优化后的效果非常大,优化后的GRAPES/ERA5 ZWD和RS ZWD被认为是无偏的。
此外,与单源数据建模相比,多源数据的引入显着增加了数据量。如果仅使用146 个探测站数据进行建模,则只有213,452 个时间文件,不包括2 年的缺失数据。引入GRAPES数据(1 526 626 248个时间文件)和ERA5数据(737 216 424个时间文件)后,数据量增加了约11,000倍。使用所有数据训练模型花费的时间太长。为了合理选择建模数据分辨率,在分析ERA5 ZWD平均海平面经纬度方向变化特征的基础上,对优化网格GRAPES/ERA5 ZWD进行下采样(图3)。
图3 2016年平均海平面年平均ERA5 ZWD随经纬度的变化
图3 2016年经纬度年平均海平面ERA5 ZWD变化
图表选项
从图3可以看出,总体ZWD随着纬度的增加而减小,减小率为-6.36 mm/(),ZWD随着经度的增加呈现明显的增加趋势,增加率为0.55。 mm/()。原因可能是研究区经度越大,离海越近,同时西高东低,海堤变高。西部地区由于山脉原因,海洋水汽难以进入,总体ZWD西部较小,东部较大,主要由水汽造成。这表明,在研究区,ZWD在纬向和经向方向上分别超过0.5和5引起的变化约为3 mm,与RS ZWD的平均精度相当[32]。因此,综合考虑模型精度和训练时间,我们将优化后的网格GRAPES/ERA5 ZWD下采样至0.55(纬度经度),并结合120个站点的RS ZWD进行建模。选择分布相对均匀的ZWD 站进行验证。建模站和检查站在图1 中用三角形和点表示。
2.2.2 训练模型
从2.1节可以看出,在训练GRNN模型时主要研究。选择后优化方法来确定。即使用不同的来训练GRNN模型,并使用10倍交叉验证[33]的准确性来测试每次训练的训练效果。基本思想是,对于每个,90%的数据(包括输入变量和输出参考值)用于训练GRNN模型,10%的数据(参考值)用于验证。这可确保您获得经过验证的结果。 [33],建模中还可以包含更多样本,这使得交叉验证结果更接近最终模型。这个过程运行10次,以确保所有数据都参与训练和测试。如果统计检验值与模型预测值的RMS不同,则根据最小RMS确定最佳。本文基于参考文献[28-29]中取得良好效果的优化方法,使用0.01到1范围内的值(间隔为0.01)重复学**过程。请注意,为了加快模型训练速度,本文每月构建一次模型,然后将12 个月的模型代码存储在一起,以便在各个点调用以形成最终模型。请。图4 显示了使用不同 训练的August GRNN 模型对应的RMS。
图4 不同训练的August GRNN模型的RMS
图4 8月GRNN基于不同的RMS
图表选项
从图4中我们可以看出,先快速减小,然后逐渐增大,并在RMS等于0.02时达到最小值。因此,选择8月的=0.02来训练GRNN-F模型,其他月份的也同样确定。 1月至12月,为0.02、0.03、0.03、0.02、0.02、0.02、0.02、0.02、0.02、0.02、0.03、0.02。
3 模型精度测试
3.1 内部合规准确性及优越性分析
3.1.1 内部合规的准确性
为了检验建模方法的合理性,我们利用参与建模的数据测试了GRNN-F的内部一致性精度,并统计计算了其估计的ZWD的平均偏差、STD和RMS。结果表明,GRNN-F-ZWD的偏差为0,STD和RMS均等于24.1 mm,内部匹配精度达到厘米级。这样的内部匹配精度与基于实测气象数据模型的ZWD估计精度相当[3],表明GRNN-F具有良好的拟合效果。
由于ZWD受纬度和海拔高度的影响较大,为了反映GRNN-F内部重合精度因纬度和海拔高度的变化而变化,我们对每个纬度和海拔段统计计算GRNN-F的内部重合精度(图5)。显然,GRNN-F-ZWD的偏差绝对值首先随着纬度的增加而增大,当纬度超过35N时总体呈减小趋势,但最大值小于0.2 mm。 15 在35N和35N,STD/RMS基本相等且较大,但最大值小于30毫米,当纬度超过35时逐渐减小。偏差的绝对值在海拔500 m左右以下比较大,在其他海拔区间则变小,最大值小于0.5 mm,并且随着海拔的升高,STD/RMS整体呈下降趋势,和STD /RMS 均小于30mm。因此,GRNN-F的内部符合精度指标和波动幅度在整个研究区域都在厘米范围内,具有较高且稳定的内部符合精度。
图5 GRNN-F中匹配精度随纬度和海拔高度的变化
图5 GRNN-F内部精度随纬度和高度的变化
图表选项
由于ZWD具有明显的季节特征,我们计算了2016-2017年GRNN-F-ZWD的日空间平均偏差、STD和RMS,以检验GRNN-F满足精度的季节变化(见图6)。显然,GRNN-F-ZWD的偏差均匀分布在0附近,平均值为0(见图6(a)中的红线),是STD(24.1 mm)的1倍以上。没有跳跃。 /RMS一般夏季和秋季较大,冬季较小,但最大值仍小于48毫米。可以看出GRNN-F的内部重合精度高,具有良好的时间稳定性。
图6 GRNN-F中满足时间序列的精度
图6 GRNN-F内部精密时间序列
图表选项
3.1.2 优势分析
为了证明本文提出的建模方法的优越性,明确基于多源数据或GRNN建模的优势,RS ZWD仅120个站参与了GRNN-F和GRNN-R的建模。经验证使用。将GRNN-R和GRNN-F的精度与国际模型验证模型GPT2w(使用预设的模型函数表示不同尺度下ZWD的变化)直接估计ZWD的精度进行比较,如图2所示。
表2 120个参与模拟站的ZWD估算中不同模型的精度。
表2 120个建模站的不同模型估算ZWD的精度。
唔
表选项
从表2可以看出,GRNN-R/GRNN-F-ZWD的bias、STD、RMS绝对值均明显小于GPT2w-ZWD,bias绝对值减小近10毫米.虽然GRNN-R使用GPT2w-ZWD作为输入信息的一部分,但GRNN-F相比GPT2w有显着提高的准确性。这意味着基于GRNN的建模对GPT2w的经验值有改善作用,可以有效提高ZWD的拟合精度。 GRNN-F-ZWD 的偏差的绝对值等于GRNN-R-ZWD 的偏差的绝对值。所有其他指标均明显优于GRNN-R-ZWD。 STD 和RMS 均下降12.8%。更高质量的数据(更多源数据)建模也有助于提高ZWD拟合的有效性,我们在2.2.1节中再次证明了优化后的网格GRAPES/ERA5 ZWD和RS ZWD是无偏的。这些结果表明,基于多源数据的建模和GRNN都有助于提高ZWD的拟合精度,并且与主流建模方法相比具有一定的优势。
为了更清楚地证明本文提出的建模方法的优越性,我们给出了三个模型在每个建模站的偏差、STD和RMS(见图7)以及相应的日空间平均值(见图8)。 ) 已经计算出来。从图7可以看出,GRNN-F-ZWD和GRNN-R-ZWD的偏差绝对值在大部分区域都接近于零,空间差异很小,并且与GPT2w相比显着减小。马苏。 -ZWD.当水汽含量较高且变化较大时,剧烈的低纬度地区更加明显。 GPT2w认为,海陆交界处受海洋和陆地气候的共同影响,水汽的频繁变化导致ZWD变化更加突变,这给建模带来了巨大的挑战。在一些海陆交界处,-ZWD 仍然小于GRNN-R-ZWD,表明偏差较大。高时空分辨率的多源数据有利于揭示ZWD更详细的变化。与GPT2w-ZWD相比,GRNN-F-ZWD和GRNN-R-ZWD的STD/RMS在不同地区更加明显,特别是在邻近印度洋和太平洋的地区。这些区域GRNN-F-ZWD的/RMS低于GPT2w-ZWD,并且与GRNN-R-ZWD相比RMS也有所降低。这些地区分别受到东亚季风和南亚季风的影响。由于水汽含量较高,ZWD变化较大,用预设模型特征表达不同尺度ZWD变化的GPT2w精度就位于这些区域,且这些区域明显较弱,基于这两个区域与GPT2w 相比,GRNN 在这些方面明显提高了准确性,尤其是基于多源数据的GRNN-F。可以看出,本文的建模方法在研究区的ZWD拟合中具有明显的优势,并且在ZWD变化较为极端的地区仍然具有显着的优势。图8显示,与其他两个模型(GRNN-F-ZWD和GRNN-R-ZWD)相比,GPT2w-ZWD的偏差分布更加离散且高度可变。
的bias均匀分布在0左右,无过大跳变;两年间,GPT2w-ZWD的STD/RMS起伏最大、值也最大,GRNN-R-ZWD的值居中,GRNN-F-ZWD的值最小、离散性也最小,且出现了很多STD/RMS接近于0的时刻。总之,本文的建模方式在不同季节的ZWD拟合方面具有很好的优势。 图 7 不同模型估算各建模站ZWD的bias、STD和RMS Fig. 7 The bias, STD and RMS of the ZWD from different models at each modeling station 图选项 图 8 不同模型估算各建模站ZWD的每日空间平均bias、STD和RMS Fig. 8 The spatially averaged daily bias, STD and RMS from different models' ZWD from each modeling station 图选项 3.2 外符合精度 为检验模型的适应性,使用了26个未参与建模站的RS ZWD来检验GRNN-F的外符合精度。表 3为3个模型预报ZWD的总体精度。 表 3 不同模型预报未参与建模站ZWD的精度 Tab. 3 Accuracy of different models for forecasting the ZWD from the stations not included in the modeling mm 表选项 显然,GRNN-F-ZWD的bias绝对值、STD和RMS均小于GPT2w-ZWD和GRNN-R-ZWD,精度有全面的提升。相对GPT2w-ZWD,GRNN-F-ZWD的bias绝对值减少近5 mm,STD和RMS分别降低了10.8 mm (24.8%)和11.1 mm(25.3%)。可见,GRNN-F不是一个简单的GPT2w精化模型,而是一个高精度的区域模型。相比GRNN-R-ZWD,GRNN-F-ZWD的bias绝对值减少了近3 mm,STD和RMS分别减少了4.0 mm (10.9%)和4.1 mm (11.1%)。说明基于多源数据的建模可以全面提升模型在整个区域预报ZWD的精度,再次证明了本文所提建模方法的优越性。此外,对比3.1.1节的结果和表 3可发现,GRNN-F的内外符合精度很接近,模型并没有出现在非建模站点精度损失严重的情况,具有较强的适应能力。 为分析GRNN-F预报精度的空间稳定性,统计了3个模型预报未参与建模站ZWD的bias、STD和RMS随纬度(图 9)和高程(图 10)的变化。如图 9,随纬度增加,3种模型的bias并无明显变化规律;GRNN-F-ZWD的bias绝对值最小,且最稳定,在0附近徘徊;3种模型的STD/RMS随着纬度的增大呈现整体减小的趋势,这是由于水汽含量更少的中高纬度地区ZWD小于低纬度地区,ZWD变化也更加稳定;GRNN-F-ZWD的STD/RMS在所有纬度节点相对其他2种模型均有所减少,在ZWD变化较剧烈的低纬度地区减少量更大,离散性最小,最大值仍小于50 mm。可见,GRNN-F-ZWD在各纬度段均具有较高的精度,且有很好的稳定性。如图 10所示,3种模型的bias与高程关系并不明显;GRNN-F-ZWD的bias明显优于其他2种模型,尤其在稳定性方面,在0附近波动,最大绝对值小于20 mm;3种模型的STD/RMS整体与高程呈负相关关系,这是由于随着高程的增加水汽含量越来越低,ZWD变化更加稳定导致的;所有站点处GRNN-F-ZWD的STD/RMS均最小,振幅也最小,在ZWD变化更剧烈的低海拔地区优势更突出,峰值均小于50 mm。总体来说,GRNN-F的高预报精度在高程上有很好的稳定性。 图 9 各模型预报ZWD的bias、STD和RMS随纬度变化情况(站点随纬度升序排列) Fig. 9 The bias, STD, and RMS of the forecasted ZWD from each model at RS stations sorted in ascending latitude 图选项 图 10 各模型预报ZWD的bias、STD和RMS随高程变化情况(站点随高程升序排列) Fig. 10 The bias, STD, and RMS of the forecasted ZWD from each model at RS stations sorted in ascending altitude 图选项 为检验模型精度的时间稳定性,统计了3种模型预报26个站ZWD的每日空间平均bias、STD和RMS,结果见图 11。可以看到,GRNN-F-ZWD的bias绝对值在四季中大多小于GRNN-R-ZWD和GPT2w-ZWD,变化范围也明显更小,随着季节变迁没有明显的变化规律,最大绝对值小于48 mm,没有出现大的跳变,较稳定。不同季节,GRNN-F-ZWD的STD/RMS最小,振幅最小,随时间变化最平稳。所有模型的STD/RMS均在夏季出现较大值,这是因为研究区域内夏季降雨更丰富,水汽活动更活跃,ZWD变化较剧烈,因而更加难以模型化。尽管如此,基于多源数据和GRNN建模的GRNN-F模型在夏季相对其他模型仍然具有相对较高的精度,相比GPT2w, STD/RMS减小量的均值、最小值、最大值和中位数分别为12.4/14.2 mm、-6.4/-11.5 mm、44.2/43.9 mm和12.4/14.0 mm。由此说明,GRNN-F-ZWD在不同季节表现出更高的符合度。 图 11 不同模型预报ZWD的每日空间平均bias、STD和RMS Fig. 11 The spatially averaged daily bias, STD, and RMS of the forecasted ZWD from each model at RS stations 图选项 3.3 GRNN-F计算ZWD的效率及其在PPP中的应用效果 相比如何构建模型,用户可能更关心计算ZWD的效率,因此统计了GRNN-F生成365 d、时间分辨率为5 min的单站ZWD总耗时。结果表明,生成105 120个ZWD总耗时为1 325.665 s,即计算ZWD的平均效率为0.012 6 s/个。且GRNN-F只需输入时间、坐标和GPT2w-ZWD经验值即可提前生成ZWD,可以满足GNSS实时应用的需求。 已有研究表明,将高精度ZWD约束到PPP中可以改善收敛速度和坐标高程分量的精度,在此分别将GPT2w-ZWD和GRNN-F-ZWD约束到PPP中,并对其收敛速度和U方向的精度进行比较,以验证GRNN-F应用于PPP的效果。约束策略为:使用GPT生成ZHD进行ZHD改正,然后将GPT2w-ZWD和GRNN-F-ZWD分别作为虚拟观测量约束进PPP中,具体的解算软件、策略、收敛条件及外部参考数据见表 4。需要说明的是,使用GPT生成ZHD是为了避免GPT2w-ZHD和GPT2w-ZWD的自洽性。对流层延迟计算和估计不准确会使得定位精度降低,收敛时间延缓。尤其在极端天气情况下,如降雨,会导致水汽剧烈波动,使得ZWD变化更加复杂,难以准确估算对流层延迟,导致PPP收敛时间延缓。因此,选用了IGS测站JFNG站2017年DOY3(晴)、DOY86(晴)、DOY188(雨)、DOY224(雨)的观测数据,分别利用GPT2w-ZWD(方法1)和GRNN-F-ZWD(方法2)为虚拟观测量约束进行精密单点定位,来检验新模型相比GPT2w对PPP的改进效果。表 5和图 12给出了两种方法约束PPP的收敛时间和U方向的精度。显然,除了DOY86(晴)天有细微的劣势外,其他天GRNN-F-ZWD约束PPP的收敛时间均等于或小于GPT2w-ZWD,收敛速度平均提升了22.37%,尤其是雨天的优势更加明显。可能是由于晴天的对流层延迟变化相对平缓,GPT2w和GRNN-F预报ZWD的精度相差不大,但雨天ZWD在天气尺度的变化更加复杂,GRNN-F能较好地刻画这些天气尺度的变化,这是GPT2w等经验模型不具备的,再次证明了模型的优越性。对应的U方向精度均有提升,平均提升了37.10%,雨天的提升率更明显。总的来说,GRNN-F应用于PPP的改进效果优于GPT2w。 表 4 PPP的解算策略及模型 Tab. 4 Models and strategies used in PPP 表选项 表 5 不同方法约束PPP的收敛时间和U方向的精度 Tab. 5 The accuracy of U-direction and convergence time from PPP based on different constraint methods 表选项 图 12 不同方法约束PPP收敛时间和U方向精度对比 Fig. 12 The comparison of the accuracy of U-direction and convergence time from PPP based on different constraint methods 图选项 4 结论 本文联合探空ZWD、优化后的格网ERA5/GRAPES ZWD和GRNN,将机器学**引入到ZWD的建模领域,建立了相比国际典范经验模型精度更高、时空稳定性更强的ZWD预测模型(GRNN-F)。试验结果显示:①GRNN-F内符合精度bias等于0,STD/RMS均小于25 mm,拟合效果较为理想,且有很好的时空稳定性;②多源数据的引入和基于GRNN建模均有利于提高模型对ZWD的拟合精度,基于多源数据和GRNN的建模方式较主流建模方法有明显优势;③无预设模型函数的前提下,GRNN-F精度显著优于单源数据模型(GRNN-R)和通过预设模型函数表征ZWD在不同尺度上变化的模型(GPT2w),精度分别提升了11.1%和25.3%(以RS ZWD检验的RMS计),在不同时间和空间上表现出较好的预报效果和可靠性;④GRNN-F的计算效率可满足GNSS实时应用的需求,且应用于PPP的改进效果优于GPT2w。总体来说,基于多源数据和机器学**方法模型化ZWD具有明显的优越性,可为模型化ZWD提供一种思路。 致谢 感谢中国气象数据网提供的GRAPES_MESO预报数据,ECMWF提供的ERA5再分析资料,IGRA提供的探空数据。作者简介 第一作者简介:黎峻宇(1989—), 男, 博士, 讲师, 研究方向为GNSS近地空间环境监测。E-mail: yl_lijunyu@163.com 初审:张艳玲 复审:宋启凡 终审:金 君 资讯







