(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111428869.2
(22)申请日 2021.11.27
(71)申请人 北京工业大 学
地址 100124 北京市朝阳区平乐园10 0号
(72)发明人 林绍福 赵俊杰 张羽民 李建强
刘希亮
(74)专利代理 机构 北京思海天达知识产权代理
有限公司 1 1203
代理人 沈波
(51)Int.Cl.
G06Q 10/04(2012.01)
G06N 3/04(2006.01)
G06N 3/06(2006.01)
G06N 3/08(2006.01)
G06Q 50/26(2012.01)
(54)发明名称
一种基于S T-CCN-PM2.5的PM2.5浓度细粒度
预测方法
(57)摘要
本发明公开了一种基于ST ‑CCN‑PM2.5的
PM2.5浓度细粒度预测方法, 该方法从与目标站
点空间强相关的站点数据中挖掘时空依赖特征,
以提升PM2.5的单步预测精度。 对采集到的空气
污染物及气象数据进行了插值处理、 特征选择、
数据扩充等预处理。 利用相关性 分析及空间注意
力机制, 提取融合与目标站点空间强相关的站点
信息; 采用基于时间注意力的膨胀卷积网络, 优
化了输入数据窗口大小并扩展了预测覆盖的时
域范围。 然后基于S T‑CCN‑PM2.5模型进行了相关
性阈值、 数据归一化、 数据集划分等超参数调优
的实验以辅助优化模型。 最后将多站点数据集用
于对该模型的训练。 本发明克服了传统RNN模型
的梯度问题、 复杂体系结构等弊端, 为PM2.5浓度
细粒度预测提供了一个开 放研究框架。
权利要求书3页 说明书8页 附图2页
CN 113962489 A
2022.01.21
CN 113962489 A
1.一种基于ST ‑CCN‑PM2.5的PM2.5浓度细粒度预测方法, 其特 征在于: 步骤如下:
(1)获取各个空气监测站的空气污染物及气象的小时级监测数据, 并对数据进行存储
和预处理;
(2)从与目标站点空间强相关的站点数据 中挖掘时空依赖特征, 构建ST ‑CCN‑PM2.5模
型;
(3)调整相关性阈值、 数据归一化、 数据划分以及滑动窗口参数, 进行多组对比实验, 完
成超参数调优;
(4)对参数调优后的ST ‑CCN‑PM2.5模型进行训练, 并与基准模型进行性能比较;
(5)输出目标站点未来 一小时PM2.5浓度预测值。
2.根据权利要求1所述的一种基于ST ‑CCN‑PM2.5的PM2.5浓度细粒度预测方法, 其特征
在于, 所述 步骤(1)中, 进行 数据预处 理包括:
(1)对采集到的空气污染物与气象数据中的缺失值进行填充; 对于时间跨度较小的缺
失值, 采用线性插值或者二次插值来填充缺 失值; 对于长时间跨度的缺 失值的情况, 使用临
近日期内相同时间段的数据进行填充;
(2)计算NO2、 风向、 风速、 PM10、 CO、 相对湿度、 大气压力、 温度、 SO2、 O3特征序列与PM2.5
浓度序列的相关性, 选择与PM2.5相关性小的因素作为输入ST ‑CCN‑PM2.5模型的特 征;
(3)由筛选得到的特征序列构建特征矩阵, 将95个站点的特征矩阵扩充至初始矩阵的
五倍规模。
3.根据权利要求1所述的一种基于ST ‑CCN‑PM2.5的PM2.5浓度细粒度预测方法, 其特征
在于, 所述 步骤(2)中, 构建ST ‑CCN‑PM2.5模型包括:
(1)利用相关性分析及空间注意力机制提取、 融合空间强相关站点信息, 具体步骤包
括:
(a)计算目标站点和其他站点PM2.5历史数据之间相关性系数, 使用皮尔森相关性系数
衡量两个站点的相互影响程度; 计算公式如下 所示:
其中Y*代表目标站点PM2.5浓度历史数据, Yi代表其他站点PM2.5浓度历史数据; cov()
是协方差函数,
和
分别是两个站点数据的方差; 由上述公式计算得到目标站点和全 部
站点的相关性系数ρ _l ist, 如下 所示:
ρ _list=[ρ(Y*,Y1), ρ(Y*,Y2),..., ρ(Y*,YM)] (2)
在(2)式中获取了全部M个站点和目标站点的相 关性系数; 将相 关性系数和阈值比较,
最终得到与目标站点相关性系数 大于ρth的站点数据的集 合如下:
X={Xi|ρ(Y*,Yi)>ρth,i∈1,...,N} (3)
在(3)式中, Xi∈RT×L为第i个与目标站点空间强相关站点的特征矩阵, X∈RM×T×L代表与
目标站点空间强相关的三 维特征矩阵, 其中M<=N, M代表与目标站 点空间强相关的站 点数
量;
(b)利用1 ×1卷积核, 对X∈RM×T×L这个特征矩阵中M个通道的特征值进行线性组合来完
成升维操作, 经 过升维处 理后三维矩阵变为
其中Mnew表示升维后的通道数量;权 利 要 求 书 1/3 页
2
CN 113962489 A
2在升维过程中, 采用的1 ×1卷积核数量大于特征矩阵的通道数量, 经过卷积运算使不
同通道信息得以交互和融合, 从而增大输入矩阵通道数量, 提升模型对非线性特征 的提取
能力;
(c)基于空间注意力机制实现降维操作, 提取各通道第i项特征序列与目标站点第i项
特征序列的相关性系数, 基于相关性信息计算权重 分布, 各通道第i项 特征序列 依据权重值
线性组合 为该特征的序列; 循环进行 此过程将三维特 征矩阵聚合至二维矩阵;
首先对目标站点的第i个特征序列与Mnew个特征矩阵中的第i个特征序列进行相关性分
析, 计算皮尔逊相关性系数; 计算公式如下 所示:
在(4)式中
表示第m个通道第 i个特征序列与目标序列的相关性,
表示目
标站点的第i个特征序列,
表示第m个通道的第i个特征序列, Pearson()表示皮尔逊
相关性系数的计算方法;
其次引入SoftMax的计算方法对第一阶段的相 关性系数进行数值转换, 将原始相 关性
系数整理成所有元素权重 之和为1的概率分布, 这样做也能更加突出重要 特征序列的权重;
计算公式如下:
其中
表示第m个通道的第i个特 征序列的注意力权 重;
最后, 将各通道的第i项特征序列乘以对应的权重值再求和, 使第i项特征序列聚合为
最终序列, 由聚合后的各项特征序列构成最终特征矩阵; 因此最终降维聚合后的特征序列
及特征矩阵应如以下公式所示:
(2)利用膨胀卷积从特 征矩阵中提取有效的时间依赖关系, 具体步骤 包括;
(a)使用步骤(1)最终形成的二 位特征矩阵作为时序数据输入膨胀卷积;
(b)膨胀卷积允许卷积时的输入存在间隔采样, 采样率受到膨胀因子d的控制; 最下面
一层d=1, 表示输入时每个点都采样, 中间层d=2, 表示输入时每两个点采样一个作为输
入; 随着层数的升高, 膨胀因子呈指数型增长; 在不同网络层次中提取到不同周期的时间依
赖关系, 提升数据预测的准确性; 在xt处的膨胀因子为d的膨胀卷积如下 所示:
如公式(7)所示, 滤波器F=(f1,f2,…,fK), 序列X=(x1,x2,…,xT), *d为膨胀卷积运算
符; K表示膨胀卷积内核大小, T代表历史数据时长; 在低网络层中, 滤波器fk与t‑(K‑k)d时
刻的数据进 行卷积, 最后求和, 得到高一级层次中t时刻的数据; 设置滤波器大小k=3, 网络
深度为4, 且使用d=2i的膨胀因子, 以此来保证预测结果覆盖到长期历史数据, 避免引入噪权 利 要 求 书 2/3 页
3
CN 113962489 A
3
专利 一种基于ST-CCN-PM2.5的PM2.5浓度细粒度预测方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:03:40上传分享