计算机科学与信息管理系

代表性课题-新闻事件的线索化方法研究

发表时间:2018-06-13 09:57

教育部人文社会科学研究项目青年基金-新闻事件的线索化方法研究(15YJCZH057)

发明专利:一种面向中文新闻文本的事件地点抽取方法

  该方法从新闻文本中抽取上下文特征、位置特征、拓扑特征三个特征构成特征向量,利用Random Forest分类器从分词获取机构名、处所名词、地名中识别出事件地点;能够在地名识别的基础上,进一步识别出新闻事件发生的地点。

发明专利:一种从维基中抽取领域术语间上下位关系的方法

  该方法从维基中特定领域的页面与超链接中提取文本特征与拓扑特征,利用Random Forest分类器从超链接中自动抽取出上下位关系。

  该研究可应用于各级新闻网站与网络舆情分析系统,能够为用户带来更好的使用体验。

  上述成隶属于2015年教育部人文社会科学研究项目青年基金:新闻事件的线索化方法研究,项目编号为:15YJCZH057。


文章分类: 数据技术与应用所