国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210763291.4 (22)申请日 2022.06.30 (71)申请人 南京林业大 学 地址 210037 江苏省南京市玄武区龙蟠路 159号 (72)发明人 李放 闵永军  (51)Int.Cl. G06F 16/215(2019.01) G06F 30/27(2020.01) G06F 30/20(2020.01) (54)发明名称 一种电动汽车动力电池大 数据清洗方法 (57)摘要 本发明公开了一种电动汽车动力电池大数 据清洗方法, 具体包括: 数据平台接收并储存间 隔为10秒/帧的动力电池实时运行大数据, 数据 平台剔除充电工况信息, 将连续缺失数据删除后 计算数据总数, 基于异常值筛选因子的箱线图筛 选异常数据, 若异常数据量大于数据总数的一定 比例, 则通过增加异常值筛选因子扩 大箱线图的 筛选范围直到满足筛选要求, 删去异常数据后再 次删除连续缺失数据, 最后判断剩余缺失数据的 缺失类型, 根据不同的缺失类型选择滑动平均填 充或支持向量回归填充。 该方法实现了基于数据 规模的自适应异常值筛选, 并对缺失数据分类填 充, 可为数据平台评估驾驶人的驾驶经济性提供 高效、 准确的大 数据清洗 。 权利要求书1页 说明书7页 附图5页 CN 115145900 A 2022.10.04 CN 115145900 A 1.一种电动汽车动力电池大数据清洗方法, 其特征在于, 数据平台以GB/T ‑32960的要 求接收并储存间隔为10秒/帧的动力电池实时运行大数据, 数据平台剔除停车充电片段和 充电完成片段, 删除连续两帧及以上 的缺失数据, 基于异常值筛选因子的箱线图筛选异常 数据, 若异常数据量小于数据总 数的p%, 则删除异常数据, 若异常数据量大于数据总数 的 p%, 则增大异常值筛选因子扩大箱线图筛选范围重新筛选异常值, 直到异常值数量小于数 据总数的p%后删除异常数据, 删去异常数据后再次删除连续两帧及以上的缺 失数据, 判断 空白数据的缺失类型, 选择滑动平均填充或支持向量回归填充。 2.一种电动汽车动力电池大数据清洗方法, 其特征在于, 所述动力电池实时运行大数 据, 包括: 充电状态、 总电压、 总电流、 SOC、 电池 单体电压最高值、 电池 单体电压最低值、 最高 温度值、 最低温度值。 3.一种电动汽车动力电池大数据清洗方法, 其特征在于, 所述基于异常值筛选因子的 箱线图筛选异 常数据, 包括: 记K为异 常值筛选 因子, 此时总数据的中位数为Q2, 上四分位点 即总数据从小到大排列后, 位于25%位置的数值为Q3, 下四分位点即总数据从小到大排列 后, 位于75%位置的数值为Q1, 记箱线图长度为IQR=Q3‑Q1, 箱线图上边缘Fenceu=Q3+K× IQR, 箱线图下边缘Fencel=Q1‑K×IQR, 将满足( ‑∞, Fencel)∪(Fenceu, +∞)的数据标记为 异常值。 4.一种电动汽车动力电池大数据清洗方法, 其特征在于, 所述若异常数据量大于数据 总数的p%, 则增大异常值筛选因子, 包括: 若异常数据量大于数据总数的p%, 则取消对异 常值的标记, 增大异常筛 选因子, 规则为K=K+a。 5.一种电动汽车动力电池大数据清洗方法, 其特征在于, 所述判断空白数据的缺失类 型, 选择滑动平均填充或支持向量回归填充, 包括: 若某帧中总电压、 总电流全部缺 失, 则对 充电状态、 SOC、 电池单体电压最高值、 电池单体电压最低值、 最高温度值、 最低温度值使用 上一帧的数据填充, 总电压、 总电流、 使用滑动平均填充即由两侧的k个值的加权平均值进 行补充, 即前k帧和后k帧的总电压或总电流的平均值填充缺失值, 若某帧中总电压和总电 流仅存在一项缺失, 则对充电状态、 SOC、 电池单体电压最高值、 电池单体电压最低值、 最高 温度值、 最低温度值使用上一帧的数据填充, 对缺失总电压或缺失总电流使用支持向量回 归填充。权 利 要 求 书 1/1 页 2 CN 115145900 A 2一种电动汽车动力电池大数据清洗方 法 技术领域 [0001]本发明涉及电动汽车动力电池数据处理技术领域, 具体涉及一种电动汽车动力电 池大数据清洗方法。 背景技术 [0002]基于电动汽车动力电池大数据 评估驾驶人的驾驶经济性可帮助公交、 出租等运营 企业开展节能研究并提高经济效益, 由于一些不利天气、 城市建筑的阻挡干扰, 或设备的稳 定性不佳, 数据平台在接 收和储存电动汽车动力电池大数据时, 可能存在传输数据丢失或 者传输数据异常的情况, 导致原始数据中存在着异常和缺失数据, 因此数据清洗的质量直 接影响评估模型精度, 由于实车数据受多种工况和道路 复杂性的影响, 数据维度多、 变化范 围大, 当前数据 清洗方法易将行驶工况中驾驶员应对突 发事件的应急操作和电动汽车少数 工况时的数据误判为异常值删除, 且对缺失的空白数据填充精度低。 中国专利 CN114328473A通过将采集数据与人为选取的预设固定值对比从而判定是否删除数据, 然而 其预设固定值的主观选取直接影响到数据 清洗的质量; 中国专利CN 113406513A提出对汽 车 不同工况下使用不同的插值策略填充缺失值, 但在部分数据缺失的情况下, 未利用其他未 缺失数据的关联信息对缺 失数据进行填充以提高填充精度, 因此当前电动汽车动力电池大 数据清洗亟需一种针对数据平台动力电池大 数据特点的自适应数据清洗方法。 发明内容 [0003]本发明所要解决的技术问题在于针对上述现有技术中的不足, 提供一种电动汽车 动力电池大数据清洗方法, 通过基于异常值筛选系 数的箱线图建立自适应异常值筛选, 根 据缺失数据类型选择不同的填充策略, 对于部分缺失数据, 利用其他未缺失数据的关联信 息提高填充精度, 该方法可提高数据清洗质量, 以解决数据平台评估驾驶人 的驾驶经济性 时存在数据缺失和异常值影响评估 模型精度的问题。 [0004]本发明解决其技术问题所采用的技术方案是: 一种电动汽车动力电池大数据清洗 方法, 具体包括以下步骤: [0005]步骤l, 数据平台以GB/T ‑32960的要求接收并储存间隔为10秒/帧的动力电池实 时 运行大数据系统信息, 具体包括: 充电状态、 总电压、 总电流、 SOC、 电池单体电压最高值、 电 池单体电压最低值、 最高温度值、 最低温度值, 其中SOC为动力电池当前剩余电荷量与满电 时最大电荷量的比值。 [0006]步骤2, 数据平台根据充电状态剔除停车充电片段和充电完成片段。 [0007]步骤3, 按照时间索引顺序遍历数据, 连续两帧和大于两帧的连续全部缺失数据做 删除处理。 [0008]步骤4, 统计删除连续 缺失数据后的数据总数N, 记 异常值筛 选因子K。 [0009]步骤5, 记此时总数据的中位数为Q2, 上四分位点即总数据从小到大排列后, 位于 25%位置的数值为Q3, 下四分位点即总数据从小到大排列后, 位于75%位置的数值为Q1, 记说 明 书 1/7 页 3 CN 115145900 A 3

.PDF文档 专利 一种电动汽车动力电池大数据清洗方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种电动汽车动力电池大数据清洗方法 第 1 页 专利 一种电动汽车动力电池大数据清洗方法 第 2 页 专利 一种电动汽车动力电池大数据清洗方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:36:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。