本申请在显著减少人工参与的同时可以得到实体类型更加完备、准确性更高的命名实体识别结果?mt4使用教程视频专利摘要显示,本申请供应了一种文本数据统治设施,涉及狂言语模子,其征求:从第一倾向数据集获取征求第一待识别文本、第一实体文本以及实体类型的第一实体数据;辨别采用第一和第二预设数目的实体类型行动候选正例和负例;基于第一待识别文本、第一实体文本、候选正例和负例,操练天生式言语模子;基于第二倾向数据集和实体类型集中,构筑征求第二待识别文本和候选实体类型的第二实体数据,实体类型集中基于倾向学问图谱中的众个标签而构筑;以及将第二实体数据输入经操练的天生式言语模子,以获取第二待识别文本中的第二实体文本和实体类型。本申请正在明显淘汰人工到场的同时可能获得实体类型加倍完美、无误性更高的定名实体识别结果。
转载请注明出处。