您好,欢迎来到抵帆知识网。
搜索
您的当前位置:首页一种基于大数据的关键信息内容匹配识别的方法[发明专利]

一种基于大数据的关键信息内容匹配识别的方法[发明专利]

来源:抵帆知识网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111104683 A(43)申请公布日 2020.05.05

(21)申请号 201911128766.7(22)申请日 2019.11.18

(71)申请人 惠州学院

地址 516000 广东省惠州市惠城区河南岸

马庄冷水坑(72)发明人 蔡昭权  曹建忠 蔡映雪 

陈伽 黄思博 罗伟 汪华斌 (74)专利代理机构 广州市时代知识产权代理事

务所(普通合伙) 44438

代理人 卢浩(51)Int.Cl.

G06F 21/60(2013.01)G06F 21/62(2013.01)G06F 21/55(2013.01)G06F 16/906(2019.01)

权利要求书2页 说明书5页 附图4页

G06F 16/903(2019.01)G06F 16/953(2019.01)

CN 111104683 A()发明名称

一种基于大数据的关键信息内容匹配识别的方法(57)摘要

本发明公开了一种基于大数据的关键信息内容匹配识别的方法,涉及大数据信息匹配领域,该基于大数据的关键信息内容匹配识别的方法,包括访问信息、数据分析服务器、数据库和云端,所述访问信息的输出端与信息清理模块的输入端电连接,所述访问信息和信息清理模块的输出端均与输入模块一的输入端电连接,所述数据分析服务器包括数据收集模块、数据分析模块、数据检测模块、数据分类模块和数据存储模块,所述输入模块一的输出端与数据收集模块的输入端电连接。解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。

CN 111104683 A

权 利 要 求 书

1/2页

1.一种基于大数据的关键信息内容匹配识别的方法,包括访问信息(1)、数据分析服务器(2)、数据库(3)和云端(4),其特征在于:所述访问信息(1)的输出端与信息清理模块(5)的输入端电连接,所述访问信息(1)和信息清理模块(5)的输出端均与输入模块一(6)的输入端电连接;

所述数据分析服务器(2)包括数据收集模块(7)、数据分析模块(8)、数据检测模块(9)、数据分类模块(10)和数据存储模块(11),所述输入模块一(6)的输出端与数据收集模块(7)的输入端电连接,所述数据收集模块(7)的输出端与数据分析模块(8)的输入端电连接,所述数据分析模块(8)的输出端与数据检测模块(9)的输入端电连接,所述数据检测模块(9)的输出端与杀毒系统(12)的输入端电连接,所述杀毒系统(12)的输出端与处理器(13)的输入端电连接,所述数据检测模块(9)的输出端与数据分类模块(10)的输入端电连接,所述数据分类模块(10)的输出端与数据存储模块(11)的输入端电连接,所述数据存储模块(11)的输出端与处理器(13)的输入端电连接,所述处理器(13)与显示模块(14)双向电连接;

所述数据库(3)包括检索模块(15)和存储模块(16),所述检索模块(15)与存储模块(16)双向电连接,所述检索模块(15)的输出端与处理器(13)的输入端电连接,所述处理器(13)的输出端与通信模块(17)的输入端电连接,所述通信模块(17)的输出端与检索模块(15)的输入端电连接;

所述搜索引擎(18)包括输入模块二(19)、信息采集单元(20)、信息分类单元(21)、信息存储单元(22)和输出模块(23),所述检索模块(15)的输出端与输入模块一(6)的输入端电连接,所述输入模块二(19)的输出端与信息采集单元(20)的输入端电连接,所述信息采集单元(20)的输出端与信息分类单元(21)的输入端电连接,所述信息分类单元(21)的输出端与信息存储单元(22)的输入端电连接,所述信息存储单元(22)的输出端与输出模块(23)的输入端电连接,所述输出模块(23)的输出端与检索模块(15)的输入端电连接,所述信息采集单元(20)与云端(4)双向电连接。

一种基于大数据的关键信息内容匹配识别的方法,包括如下步骤:S1、输入访问信息(1)启动信息清理模块(5),信息清理模块(5)将输入模块一(6)内的前次访问信息(1)清除,在输入模块一(6)的对话框内输入访问信息(1)访问网络空间;

S2、数据分析服务器(2)拦截访问信息(1),数据收集模块(7)对采集访问信息(1),通过数据分析模块(8)分析访问信息(1)的属性和内容是否符合网络健康安全标准,数据检测模块(9)检测访问信息(1)是否具有访问权限,若不具有访问权限,则通过杀毒系统(12)将其拦截后屏蔽,杀毒系统(12)将屏蔽结果传送到处理器(13),处理器(13)通过显示模块(14)显示无搜索结果,若具有访问权限,数据检测模块(9)将检测后的访问信息(1)传送给数据分类模块(10),按照访问信息(1)的属性和关键词分类,将其存储在数据存储模块(11)内,存储完毕处理器(13)执行命令;

S3、处理器(13)通过通信模块(17)与数据库(3)通信,检索模块(15)检索采集存储模块(16)内的存储数据,若数据库(3)内存储相关访问信息(1)的访问内容,存储模块(16)即将访问内容通过检索模块(15)反馈给处理器(13),处理器(13)将访问内容传输到显示模块(14);

S4、若数据库(3)内没有存储相关访问信息(1)的访问内容,存储模块(16)通过检索模

2

CN 111104683 A

权 利 要 求 书

2/2页

块(15)向搜索引擎(18)的输入模块二(19)发出命令,输入模块二(19)向信息采集单元(20)发送命令搜集云端(4)的相关访问信息(1)的访问内容,云端(4)将访问内容反馈给信息采集单元(20)并通过信息分类单元(21)分类,即可将该访问内容储存在搜索引擎(18)的信息存储单元(22)内,便于下次搜索时直接访问,信息存储单元(22)通过输出模块(23)向检索模块(15)执行命令,检索模块(15)将访问内容传送给处理器(13),处理器(13)通过显示模块(14)向用户显示访问信息(1)的相关访问内容。

2.根据权利要求1所述的一种基于大数据的关键信息内容匹配识别的方法,其特征在于:所述存储模块(16)包括信息存储单元一(24)和信息存储单元二(25)。

3.根据权利要求1所述的一种基于大数据的关键信息内容匹配识别的方法,其特征在于:所述处理器(13)包括诊断模块(26)和传输模块(27),所述诊断模块(26)的输出端与传输模块(27)的输入端电连接。

4.根据权利要求1所述的一种基于大数据的关键信息内容匹配识别的方法,其特征在于:所述杀毒系统(12)为上网过滤软件的信息屏蔽系统。

5.根据权利要求1所述的一种基于大数据的关键信息内容匹配识别的方法,其特征在于:所述输入模块一(6)为输入信息关键字的对话框。

3

CN 111104683 A

说 明 书

一种基于大数据的关键信息内容匹配识别的方法

1/5页

技术领域

[0001]本发明涉及大数据信息匹配技术领域,具体为一种基于大数据的关键信息内容匹配识别的方法。

背景技术

[0002]随着云时代的来临,大数据也吸引了越来越多的关注,大数据是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性,由人类日益普及的网络行为所伴生,从海量数据中提取出有用的信息,这对网络架构和数据处理能力而言也是巨大的挑战,大数据就是互联网发展到现今阶段的一种表象或特征,基于大数据的关键信息内容匹配识别的方法对于准确提取出有用的信息至关重要,简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,大数据最核心的价值就是在于对于海量数据进行存储和分析,相比起现有的其他技术而言,大数据的廉价、迅速和优化这三方面的综合成本是最优的,正是这一点促使该技术具备走向众多企业的潜力。

[0003]现有针对大数据的关键信息内容在匹配识别时通常识别度不是很高,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息的工作量。发明内容[0004](一)解决的技术问题[0005]针对现有技术的不足,本发明提供了一种基于大数据的关键信息内容匹配识别的方法,解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。[0006](二)技术方案

[0007]为实现上述目的,本发明提供如下技术方案:一种基于大数据的关键信息内容匹配识别的方法,包括访问信息、数据分析服务器、数据库和云端,所述访问信息的输出端与信息清理模块的输入端电连接,所述访问信息和信息清理模块的输出端均与输入模块一的输入端电连接。

[0008]所述数据分析服务器包括数据收集模块、数据分析模块、数据检测模块、数据分类模块和数据存储模块,所述输入模块一的输出端与数据收集模块的输入端电连接,所述数据收集模块的输出端与数据分析模块的输入端电连接,所述数据分析模块的输出端与数据检测模块的输入端电连接,所述数据检测模块的输出端与杀毒系统的输入端电连接,所述杀毒系统的输出端与处理器的输入端电连接,所述数据检测模块的输出端与数据分类模块的输入端电连接,所述数据分类模块的输出端与数据存储模块的输入端电连接,所述数据存储模块的输出端与处理器的输入端电连接,所述处理器与显示模块双向电连接。

[0009]所述数据库包括检索模块和存储模块,所述检索模块与存储模块双向电连接,所述检索模块的输出端与处理器的输入端电连接,所述处理器的输出端与通信模块

4

CN 111104683 A

说 明 书

2/5页

的输入端电连接,所述通信模块的输出端与检索模块的输入端电连接。[0010]所述搜索引擎包括输入模块二、信息采集单元、信息分类单元、信息存储单元和输出模块,所述检索模块的输出端与输入模块一的输入端电连接,所述输入模块二的输出端与信息采集单元的输入端电连接,所述信息采集单元的输出端与信息分类单元的输入端电连接,所述信息分类单元的输出端与信息存储单元的输入端电连接,所述信息存储单元的输出端与输出模块的输入端电连接,所述输出模块的输出端与检索模块的输入端电连接,所述信息采集单元与云端双向电连接。

[0011]一种基于大数据的关键信息内容匹配识别的方法,包括如下步骤:[0012]S1、输入访问信息启动信息清理模块,信息清理模块将输入模块一内的前次访问信息清除,在输入模块一的对话框内输入访问信息访问网络空间。[0013]S2、数据分析服务器拦截访问信息,数据收集模块对采集访问信息,通过数据分析模块分析访问信息的属性和内容是否符合网络健康安全标准,数据检测模块检测访问信息是否具有访问权限,若不具有访问权限,则通过杀毒系统将其拦截后屏蔽,杀毒系统将屏蔽结果传送到处理器,处理器通过显示模块显示无搜索结果,若具有访问权限,数据检测模块将检测后的访问信息传送给数据分类模块,按照访问信息的属性和关键词分类,将其存储在数据存储模块内,存储完毕处理器执行命令。[0014]S3、处理器通过通信模块与数据库通信,检索模块检索采集存储模块内的存储数据,若数据库内存储相关访问信息的访问内容,存储模块即将访问内容通过检索模块反馈给处理器,处理器将访问内容传输到显示模块。[0015]S4、若数据库内没有存储相关访问信息的访问内容,存储模块通过检索模块向搜索引擎的输入模块二发出命令,输入模块二向信息采集单元发送命令搜集云端的相关访问信息的访问内容,云端将访问内容反馈给信息采集单元并通过信息分类单元分类,即可将该访问内容储存在搜索引擎的信息存储单元内,便于下次搜索时直接访问,信息存储单元通过输出模块向检索模块执行命令,检索模块将访问内容传送给处理器,处理器通过显示模块向用户显示访问信息的相关访问内容。[0016]优选的,所述存储模块包括信息存储单元一和信息存储单元二。[0017]优选的,所述处理器包括诊断模块和传输模块,所述诊断模块的输出端与传输模块的输入端电连接。[0018]优选的,所述杀毒系统为上网过滤软件的信息屏蔽系统。[0019]优选的,所述输入模块一为输入信息关键字的对话框。[0020](三)有益效果

[0021]本发明提供了一种基于大数据的关键信息内容匹配识别的方法,具备以下有益效果:

[0022]本发明通过设置数据分析服务器、数据库、信息清理模块、杀毒系统和处理器,当访问信息访问网络空间时,通过数据检测模块判断是否为具有访问权限的信息,通过杀毒系统屏蔽不具有访问权限的访问信息,当前一次输入模块一内的访问信息未通过信息清理模块清除,则本次的访问信息若在上次访问信息的集合范围内,则本次的访问信息的访问范围则基于上次的访问信息范围之内,使本次的访问信息的访问范围缩小,达到了自动缩小访问信息的访问范围效果,无需缩小访问范围时即可通过信息清理模块清除上次访

5

CN 111104683 A

说 明 书

3/5页

问信息内容即可,访问信息的访问内容通过处理器和通信模块从数据库内获取,若数据库内没有检索到相关信息即可从云端内获取,且数据库具有自动学习能力,将从云端获取的访问信息的访问内容分类自动通过存储模块存储,便于下次检索,为下次检索相同访问信息节约了时间,达到了缩小用户筛选有用信息范围,自动保存用户常用访问信息记录的目的,解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。附图说明

[0023]图1为本发明系统原理示意图;

[0024]图2为本发明数据分析服务器原理示意图;[0025]图3为本发明搜索引擎原理示意图;[0026]图4为本发明处理器原理示意图;[0027]图5为本发明存储模块原理示意图。[0028]图中:1访问信息、2数据分析服务器、3数据库、4云端、5信息清理模块、6输入模块一、7数据收集模块、8数据分析模块、9数据检测模块、10数据分类模块、11数据存储模块、12杀毒系统、13处理器、14显示模块、15检索模块、16存储模块、17通信模块、18搜索引擎、19输入模块二、20信息采集单元、21信息分类单元、22信息存储单元、23输出模块、24信息存储单元一、25信息存储单元二、26诊断模块、27传输模块。具体实施方式

[0029]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0030]如图1-5所示,本发明提供一种技术方案:一种基于大数据的关键信息内容匹配识别的方法,包括访问信息1、数据分析服务器2、数据库3和云端4,访问信息1的输出端与信息清理模块5的输入端电连接,访问信息1和信息清理模块5的输出端均与输入模块一6的输入端电连接,访问信息1即为用户输入的信息。

[0031]数据分析服务器2包括数据收集模块7、数据分析模块8、数据检测模块9、数据分类模块10和数据存储模块11,输入模块一6的输出端与数据收集模块7的输入端电连接,数据收集模块7的输出端与数据分析模块8的输入端电连接,数据分析模块8的输出端与数据检测模块9的输入端电连接,数据检测模块9的输出端与杀毒系统12的输入端电连接,杀毒系统12的输出端与处理器13的输入端电连接,数据检测模块9的输出端与数据分类模块10的输入端电连接,数据分类模块10的输出端与数据存储模块11的输入端电连接,数据存储模块11的输出端与处理器13的输入端电连接,处理器13与显示模块14双向电连接。

[0032]数据库3包括检索模块15和存储模块16,检索模块15与存储模块16双向电连接,检索模块15的输出端与处理器13的输入端电连接,处理器13的输出端与通信模块17的输入端电连接,通信模块17的输出端与检索模块15的输入端电连接。

6

CN 111104683 A[0033]

说 明 书

4/5页

搜索引擎18包括输入模块二19、信息采集单元20、信息分类单元21、信息存储单元

22和输出模块23,检索模块15的输出端与输入模块一6的输入端电连接,输入模块二19的输出端与信息采集单元20的输入端电连接,信息采集单元20的输出端与信息分类单元21的输入端电连接,信息分类单元21的输出端与信息存储单元22的输入端电连接,信息存储单元22的输出端与输出模块23的输入端电连接,输出模块23的输出端与检索模块15的输入端电连接,信息采集单元20与云端4双向电连接。

[0034]一种基于大数据的关键信息内容匹配识别的方法,包括如下步骤:[0035]S1、输入访问信息1启动信息清理模块5,信息清理模块5将输入模块一6内的前次访问信息1清除,在输入模块一6的对话框内输入访问信息1访问网络空间。[0036]S2、数据分析服务器2拦截访问信息1,数据收集模块7对采集访问信息1,通过数据分析模块8分析访问信息1的属性和内容是否符合网络健康安全标准,数据检测模块9检测访问信息1是否具有访问权限,若不具有访问权限,则通过杀毒系统12将其拦截后屏蔽,杀毒系统12将屏蔽结果传送到处理器13,处理器13通过显示模块14显示无搜索结果,若具有访问权限,数据检测模块9将检测后的访问信息1传送给数据分类模块10,按照访问信息1的属性和关键词分类,将其存储在数据存储模块11内,存储完毕处理器13执行命令。

[0037]S3、处理器13通过通信模块17与数据库3通信,检索模块15检索采集存储模块16内的存储数据,若数据库3内存储相关访问信息1的访问内容,存储模块16即将访问内容通过检索模块15反馈给处理器13,处理器13将访问内容传输到显示模块14。[0038]S4、若数据库3内没有存储相关访问信息1的访问内容,存储模块16通过检索模块15向搜索引擎18的输入模块二19发出命令,输入模块二19向信息采集单元20发送命令搜集云端4的相关访问信息1的访问内容,云端4将访问内容反馈给信息采集单元20并通过信息分类单元21分类,即可将该访问内容储存在搜索引擎18的信息存储单元22内,便于下次搜索时直接访问,信息存储单元22通过输出模块23向检索模块15执行命令,检索模块15将访问内容传送给处理器13,处理器13通过显示模块14向用户显示访问信息1的相关访问内容。

[0039]作为本发明的一种技术优化方案,存储模块16包括信息存储单元一24和信息存储单元二25,信息存储单元一24和信息存储单元二25分别按照信息发布时间和信息属性对数据库3内数据进行分类存储,缩短检索时间,提高检索效率。[0040]作为本发明的一种技术优化方案,处理器13包括诊断模块26和传输模块27,诊断模块26的输出端与传输模块27的输入端电连接。[0041]作为本发明的一种技术优化方案,杀毒系统12为上网过滤软件的信息屏蔽系统,用于屏蔽或过滤没有访问权限的访问信息1。[0042]作为本发明的一种技术优化方案,输入模块一6为输入信息关键字的对话框,将访问信息1输入对话框内时即可执行输入模块一6或信息清理模块5的命令,输入模块一6和信息清理模块5的命令执行。[0043]在使用时,输入访问信息1启动信息清理模块5,信息清理模块5将输入模块一6内的前次访问信息1清除,在输入模块一6的对话框内输入访问信息1访问网络空间,数据分析服务器2拦截访问信息1,数据收集模块7对采集访问信息1,通过数据分析模块8分析访问信

7

CN 111104683 A

说 明 书

5/5页

息1的属性和内容是否符合网络健康安全标准,数据检测模块9检测访问信息1是否具有访问权限,若不具有访问权限,则通过杀毒系统12将其拦截后屏蔽,杀毒系统12将屏蔽结果传送到处理器13,处理器13通过显示模块14显示无搜索结果,若具有访问权限,数据检测模块9将检测后的访问信息1传送给数据分类模块10,按照访问信息1的属性和关键词分类,将其存储在数据存储模块11内,存储完毕处理器13执行命令,处理器13通过通信模块17与数据库3通信,检索模块15检索采集存储模块16内的存储数据,若数据库3内存储相关访问信息1的访问内容,存储模块16即将访问内容通过检索模块15反馈给处理器13,处理器13通过诊断模块26诊断访问内容是否与访问信息的访问内容一致,一致后通过传输模块27将访问内容传输到显示模块14,若数据库3内没有存储相关访问信息1的访问内容,存储模块16通过检索模块15向搜索引擎18的输入模块二19发出命令,输入模块二19向信息采集单元20发送命令搜集云端4的相关访问信息1的访问内容,云端4将访问内容反馈给信息采集单元20并通过信息分类单元21分类,即可将该访问内容储存在搜索引擎18的信息存储单元22内,便于下次搜索时直接访问,信息存储单元22通过输出模块23向检索模块15执行命令,检索模块15将访问内容传送给处理器13,处理器13通过显示模块14向用户显示访问信息1的相关访问内容,当前一次输入模块一6内的访问信息1未通过信息清理模块5清除,则本次的访问信息1若在上次访问信息1的集合范围内,则本次的访问信息1的访问范围基于上次的访问信息1范围之内,使本次的访问信息1的访问范围缩小,达到了自动缩小访问信息1的访问范围效果,无需缩小访问范围时即可通过信息清理模块5清除上次访问信息1内容即可,访问信息1的访问内容通过处理器13和通信模块17从数据库3内获取,若数据库3内没有检索到相关信息即可从云端4内获取,且数据库3具有自动学习能力,将从云端4获取的访问信息1的访问内容分类自动通过存储模块16存储,便于下次检索,为下次检索相同访问信息1节约了时间,达到了缩小用户筛选有用信息范围,自动保存用户常用访问信息1记录的目的。[0044]综上可得,本发明通过设置数据分析服务器2、数据库3、信息清理模块5、杀毒系统12和处理器13,解决了现有大数据技术针对大数据的关键信息内容在匹配识别时,通过关键词识别的匹配信息范围较广且内容较多,增大了用户筛选出有用信息难度的问题。[0045]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

[0046]尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

8

CN 111104683 A

说 明 书 附 图

图1

9

1/4页

CN 111104683 A

说 明 书 附 图

2/4页

图2

10

CN 111104683 A

说 明 书 附 图

3/4页

图3

图4

11

CN 111104683 A

说 明 书 附 图

4/4页

图5

12

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- dfix.cn 版权所有 湘ICP备2024080961号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务