国家标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210946807.9 (22)申请日 2022.08.09 (71)申请人 深圳市跨越新科技有限公司 地址 518000 广东省深圳市宝安区航城街 道后瑞社区深圳机场航站四路汉莎航 空园区A栋4楼 (72)发明人 寇宇 陈才宁 赵兴 (74)专利代理 机构 深圳国新 南方知识产权代理 有限公司 4 4374 专利代理师 张亚娟 (51)Int.Cl. G06F 40/279(2020.01) G06V 30/10(2022.01) G06V 30/14(2022.01) G06V 30/412(2022.01)G06F 21/62(2013.01) (54)发明名称 一种敏感信息识别方法、 装置、 设备及存储 介质 (57)摘要 本发明公开了一种敏感信息识别方法、 装 置、 设备及存储介质, 其中方法包括: 对输入图片 进行信息提取, 获得若干文字信息和每一文字信 息对应的位置信息; 将所述文字信息按照其对应 的位置信息进行排序, 按照顺序依次判断当前文 字信息是否为第一类关键词; 若为, 确定当前文 字信息处于表格中, 则判断其所处表格类型并识 别相应位置的文字信息是否含有敏感标识, 若 是, 继续识别下一个文字信息; 若否, 确定 所述输 入图片包含敏感信息; 若不为, 判断当前文字信 息是否包含第二类关键词, 若包含, 确定所述输 入图片包含敏感信息; 若不包含, 继续识别下一 个文字信息。 本发明能够在敏感信息不可见的情 况下, 高效准确的识别图片中是否存在敏感信 息, 保障信息安全。 权利要求书2页 说明书10页 附图3页 CN 115422917 A 2022.12.02 CN 115422917 A 1.一种敏感信息识别方法, 其特 征在于, 包括: 对输入图片进行信息提取, 获得若干文字信息和每一文字信息对应的位置信息; 将所述文字信 息按照其对应的位置信 息进行排序, 按照顺序依次判断当前文字信 息是 否为第一类关键词; 若为, 确定当前文字信息处于表格中, 则判断其所处表格类型并识别相应位置的文字 信息是否含有敏感标识, 若是, 继续识别下一个文字信息; 若否, 确定所述输入图片包含敏 感信息; 若不为, 判断当前文字信 息是否包含第二类关键词, 若包含, 确定所述输入图片包含敏 感信息; 若不包 含, 继续识别下一个文字信息 。 2.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述表格类型包括竖向表 格和横向表格; 所述判断其所处表格 类型, 包括: 判断所述当前文字信 息的上侧和/或下侧是否为第 一类关键词, 若是, 确定其所处表格 类型为横向表格; 若否, 判断所述当前文字信息的左侧和/或右侧是否为第一类关键词, 若是, 确定其所 处表格类型为竖向表格。 3.如权利要求2所述的一种敏感信 息识别方法, 其特征在于, 所述识别相应位置的文字 信息是否含有敏感标识, 包括: 若所述当前文字信 息所处表格类型为所述横向表格, 识别其右侧相邻的文字信 息是否 含有敏感标识; 若所述当前文字信 息所处表格类型为所述竖向表格, 识别其下侧相邻的文字信 息是否 含有敏感标识。 4.如权利要求3所述的一种敏感信 息识别方法, 其特征在于, 所述位置信 息包括每一文 字信息的左侧边界的位置信息; 识别所述当前文字信 息下侧相邻的文字信 息含有敏感标识后, 继续依次识别位于所述 当前文字信息下侧、 且左侧边界的位置信息与其相同的文字信息是否含有敏感标识。 5.如权利要求1或权利要求3或权利要求4所述的一种敏感信 息识别方法, 其特征在于, 相应位置的文字信息识别含有敏感标识后, 对其设置已识别标识; 当按照顺序依次判断当前文字信 息是否为第 一类关键词时, 跳过有已识别标识的文字 信息。 6.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述将所述文字信 息按照 其对应的位置信息进行排序, 包括: 将所述文字信息按照其对应的位置信息从左到右、 从上到下进行排序。 7.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述敏感标识用于屏蔽信 息。 8.一种敏感信 息识别装置, 其特征在于, 包括数据获取模块、 文本排序模块和判断引擎 模块; 所述数据获取模块用于对输入图片进行信 息提取, 获得若干文字信 息和每一文字信 息 对应的位置信息; 所述文本排序模块用于将所述文字信息按照其对应的位置信息进行排序;权 利 要 求 书 1/2 页 2 CN 115422917 A 2所述判断引擎模块用于按照顺序依次判断当前文字信息是否为第一类关键词; 若为, 确定当前文字信息处于表格中, 则判断其所处表格类型并识别相应位置的文字 信息是否含有敏感标识, 若是, 继续识别下一个文字信息; 若否, 确定所述输入图片包含敏 感信息; 若不为, 所述判断引擎模块继续判断当前文字信息是否包含第二类关键词, 若包含, 确 定所述输入图片包 含敏感信息; 若不包 含, 继续识别下一个文字信息 。 9.一种敏感信息识别设备, 包括处 理器和存 储器, 其中: 所述存储器用于存 储计算机程序; 所述处理器用于读取所述存储器 中的计算机程序, 并执行如权利要求1~7所述的任一 敏感信息识别方法的步骤。 10.一种计算机可读存储介质, 其上存储有可读的计算机程序, 该程序被处理器执行时 实现如权利要求1~7 所述的任一敏感信息识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 115422917 A 3
专利 一种敏感信息识别方法、装置、设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:34:39
上传分享
举报
下载
原文档
(759.2 KB)
分享
友情链接
GB-T 35285-2017 信息安全技术 公钥基础设施基于数字证书的可靠电子签名生成及验证技技术要求.pdf
XF 654-2006 人员密集场所消防安全管理.pdf
DB52-T 702-2011 杉木二元立木材积表 贵州省.pdf
绿盟 软件供应链安全技术白皮书.pdf
SC-T 1135.3-2021 稻渔综合种养技术规范 第3部分:稻蟹.pdf
T-CACM 1352—2021 慢性溃疡气虚毒滞证诊断标准.pdf
GB-T 41767-2022 聚合物基复合材料吸湿性能及平衡状态调节试验方法.pdf
ISO SAE 21434 Road vehicles— Cybersecurity engineering.pdf
GB-T 19291-2003 金属和合金的腐蚀 腐蚀试验一般原则.pdf
GB-T 29234-2012 基于公用电信网的宽带客户网络安全技术要求.pdf
T-CSAE 284.3—2022 自动驾驶乘用车 线控底盘性能要求及试验方法 第3部分:转向系统.pdf
DB21-T 1799.3—2019 信息技术 信息服务管理规范 第3部分:IT系统运维 辽宁省.pdf
GM-T 0023-2014 IPSec VPN网关产品规范.pdf
GB-T 29716.2-2018 机械振动与冲击 信号处理 第2部分:傅里叶变换分析的时域窗.pdf
GB-T 10114-2003 县级以下行政区划代码编制规则.pdf
GB-T 5000-2018 日用陶瓷名词术语.pdf
GB-T 42449-2023 系统与软件工程 功能规模测量 IFPUG方法.pdf
GB-T 34946-2017 C#语言源代码漏洞测试规范.pdf
希赛 2022中级信息安全工程师知识点集锦.pdf
GB-T 16920-2015 玻璃 平均线热膨胀系数的测定.pdf
交流群
-->
1
/
16
评价文档
赞助2元 点击下载(759.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。