国家标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111428869.2 (22)申请日 2021.11.27 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 林绍福 赵俊杰 张羽民 李建强  刘希亮  (74)专利代理 机构 北京思海天达知识产权代理 有限公司 1 1203 代理人 沈波 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/04(2006.01) G06N 3/06(2006.01) G06N 3/08(2006.01) G06Q 50/26(2012.01) (54)发明名称 一种基于S T-CCN-PM2.5的PM2.5浓度细粒度 预测方法 (57)摘要 本发明公开了一种基于ST ‑CCN‑PM2.5的 PM2.5浓度细粒度预测方法, 该方法从与目标站 点空间强相关的站点数据中挖掘时空依赖特征, 以提升PM2.5的单步预测精度。 对采集到的空气 污染物及气象数据进行了插值处理、 特征选择、 数据扩充等预处理。 利用相关性 分析及空间注意 力机制, 提取融合与目标站点空间强相关的站点 信息; 采用基于时间注意力的膨胀卷积网络, 优 化了输入数据窗口大小并扩展了预测覆盖的时 域范围。 然后基于S T‑CCN‑PM2.5模型进行了相关 性阈值、 数据归一化、 数据集划分等超参数调优 的实验以辅助优化模型。 最后将多站点数据集用 于对该模型的训练。 本发明克服了传统RNN模型 的梯度问题、 复杂体系结构等弊端, 为PM2.5浓度 细粒度预测提供了一个开 放研究框架。 权利要求书3页 说明书8页 附图2页 CN 113962489 A 2022.01.21 CN 113962489 A 1.一种基于ST ‑CCN‑PM2.5的PM2.5浓度细粒度预测方法, 其特 征在于: 步骤如下: (1)获取各个空气监测站的空气污染物及气象的小时级监测数据, 并对数据进行存储 和预处理; (2)从与目标站点空间强相关的站点数据 中挖掘时空依赖特征, 构建ST ‑CCN‑PM2.5模 型; (3)调整相关性阈值、 数据归一化、 数据划分以及滑动窗口参数, 进行多组对比实验, 完 成超参数调优; (4)对参数调优后的ST ‑CCN‑PM2.5模型进行训练, 并与基准模型进行性能比较; (5)输出目标站点未来 一小时PM2.5浓度预测值。 2.根据权利要求1所述的一种基于ST ‑CCN‑PM2.5的PM2.5浓度细粒度预测方法, 其特征 在于, 所述 步骤(1)中, 进行 数据预处 理包括: (1)对采集到的空气污染物与气象数据中的缺失值进行填充; 对于时间跨度较小的缺 失值, 采用线性插值或者二次插值来填充缺 失值; 对于长时间跨度的缺 失值的情况, 使用临 近日期内相同时间段的数据进行填充; (2)计算NO2、 风向、 风速、 PM10、 CO、 相对湿度、 大气压力、 温度、 SO2、 O3特征序列与PM2.5 浓度序列的相关性, 选择与PM2.5相关性小的因素作为输入ST ‑CCN‑PM2.5模型的特 征; (3)由筛选得到的特征序列构建特征矩阵, 将95个站点的特征矩阵扩充至初始矩阵的 五倍规模。 3.根据权利要求1所述的一种基于ST ‑CCN‑PM2.5的PM2.5浓度细粒度预测方法, 其特征 在于, 所述 步骤(2)中, 构建ST ‑CCN‑PM2.5模型包括: (1)利用相关性分析及空间注意力机制提取、 融合空间强相关站点信息, 具体步骤包 括: (a)计算目标站点和其他站点PM2.5历史数据之间相关性系数, 使用皮尔森相关性系数 衡量两个站点的相互影响程度; 计算公式如下 所示: 其中Y*代表目标站点PM2.5浓度历史数据, Yi代表其他站点PM2.5浓度历史数据; cov() 是协方差函数, 和 分别是两个站点数据的方差; 由上述公式计算得到目标站点和全 部 站点的相关性系数ρ _l ist, 如下 所示: ρ _list=[ρ(Y*,Y1), ρ(Y*,Y2),..., ρ(Y*,YM)] (2) 在(2)式中获取了全部M个站点和目标站点的相 关性系数; 将相 关性系数和阈值比较, 最终得到与目标站点相关性系数 大于ρth的站点数据的集 合如下: X={Xi|ρ(Y*,Yi)>ρth,i∈1,...,N} (3) 在(3)式中, Xi∈RT×L为第i个与目标站点空间强相关站点的特征矩阵, X∈RM×T×L代表与 目标站点空间强相关的三 维特征矩阵, 其中M<=N, M代表与目标站 点空间强相关的站 点数 量; (b)利用1 ×1卷积核, 对X∈RM×T×L这个特征矩阵中M个通道的特征值进行线性组合来完 成升维操作, 经 过升维处 理后三维矩阵变为 其中Mnew表示升维后的通道数量;权 利 要 求 书 1/3 页 2 CN 113962489 A 2在升维过程中, 采用的1 ×1卷积核数量大于特征矩阵的通道数量, 经过卷积运算使不 同通道信息得以交互和融合, 从而增大输入矩阵通道数量, 提升模型对非线性特征 的提取 能力; (c)基于空间注意力机制实现降维操作, 提取各通道第i项特征序列与目标站点第i项 特征序列的相关性系数, 基于相关性信息计算权重 分布, 各通道第i项 特征序列 依据权重值 线性组合 为该特征的序列; 循环进行 此过程将三维特 征矩阵聚合至二维矩阵; 首先对目标站点的第i个特征序列与Mnew个特征矩阵中的第i个特征序列进行相关性分 析, 计算皮尔逊相关性系数; 计算公式如下 所示: 在(4)式中 表示第m个通道第 i个特征序列与目标序列的相关性, 表示目 标站点的第i个特征序列, 表示第m个通道的第i个特征序列, Pearson()表示皮尔逊 相关性系数的计算方法; 其次引入SoftMax的计算方法对第一阶段的相 关性系数进行数值转换, 将原始相 关性 系数整理成所有元素权重 之和为1的概率分布, 这样做也能更加突出重要 特征序列的权重; 计算公式如下: 其中 表示第m个通道的第i个特 征序列的注意力权 重; 最后, 将各通道的第i项特征序列乘以对应的权重值再求和, 使第i项特征序列聚合为 最终序列, 由聚合后的各项特征序列构成最终特征矩阵; 因此最终降维聚合后的特征序列 及特征矩阵应如以下公式所示: (2)利用膨胀卷积从特 征矩阵中提取有效的时间依赖关系, 具体步骤 包括; (a)使用步骤(1)最终形成的二 位特征矩阵作为时序数据输入膨胀卷积; (b)膨胀卷积允许卷积时的输入存在间隔采样, 采样率受到膨胀因子d的控制; 最下面 一层d=1, 表示输入时每个点都采样, 中间层d=2, 表示输入时每两个点采样一个作为输 入; 随着层数的升高, 膨胀因子呈指数型增长; 在不同网络层次中提取到不同周期的时间依 赖关系, 提升数据预测的准确性; 在xt处的膨胀因子为d的膨胀卷积如下 所示: 如公式(7)所示, 滤波器F=(f1,f2,…,fK), 序列X=(x1,x2,…,xT), *d为膨胀卷积运算 符; K表示膨胀卷积内核大小, T代表历史数据时长; 在低网络层中, 滤波器fk与t‑(K‑k)d时 刻的数据进 行卷积, 最后求和, 得到高一级层次中t时刻的数据; 设置滤波器大小k=3, 网络 深度为4, 且使用d=2i的膨胀因子, 以此来保证预测结果覆盖到长期历史数据, 避免引入噪权 利 要 求 书 2/3 页 3 CN 113962489 A 3

.PDF文档 专利 一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法 第 1 页 专利 一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法 第 2 页 专利 一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:03:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。