专利名称:一种基于自然语言处理的舆情信息抽取及知识库生
成方法
专利类型:发明专利
发明人:路世伦,闫晨巍,仵伟强,周金黄,钟丽莉,万谊强申请号:CN201911117980.2申请日:20191115公开号:CN110990525A公开日:20200410
摘要:本发明公开一种基于自然语言处理的舆情信息抽取及知识库生成方法,包括如下步骤:一、文本预处理;二、命名实体识别,包括:识别公司机构名称和人名,采用基于神经网络的方法完成命名实体识别;三、关系抽取,采用特征层+GRU+Attention抽取金融领域的六类关系;四、实体链接;采用Jaro winkler distance方法,通过计算链接实体与目标实体之间的距离,来判断他们是否是同一实体,达到实体消歧。本发明方法采用端对端模型、特征提取输入类模型结合,构建从金融非结构化文本到结构化数据存储的一站式流程,充分利用金融新闻上下文信息、以更少参数和更快训练预测速度抽取知识,在金融舆情信息领域达到良好表现。
申请人:华融融通(北京)科技有限公司
地址:100033 北京市西城区金融大街8号楼5层502室
国籍:CN
代理机构:北京慧泉知识产权代理有限公司
代理人:李娜
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- kqyc.cn 版权所有 赣ICP备2024042808号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务