X
 当前位置: > 首页 -> 学术活动
博士生吴树芳《基于信念网络的话题识别与追踪研究》
分割线
报告题目:《基于信念网络的话题识别与追踪研究

报告人:吴树芳(博士生)

报告时间:2015年1月13日(周二)下午15:00 (第二场)

报告地点:新区C1-5楼报告厅

 

听众:全体研究生、教师

为加强不同科研方向间的学术交流,请老师们积极参加!

 

报告内容简介:   

话题识别与追踪作为一项旨在帮助人们应对信息过载问题的研究,以新闻专线、广播、电视以及网络等新媒体信息流为处理对象,自动发现话题并把话题相关的内容联系在一起,其实现过程涉及5个子任务,分别是新闻报道切分、新事件识别、报道关系识别、话题识别、话题追踪。话题识别与追踪技术可用来监控各种语言信息源,在新话题出现时发出警告,已广泛应用于信息安全、金融证券、行业调研等领域。

针对话题识别与追踪的主流研究集中于话题识别与话题追踪子任务,从信息获取的角度考虑,话题识别与追踪主要涉及两类问题:信息的识别与集成、信息的采集与追踪,这两方面的研究分别与信息检索和信息过滤非常相似。基于它们的共性,许多基于信息检索和信息过滤的技术都相应地应用于话题识别与追踪,并获得了良好的效果。1998年,J. Allan首次将信息检索领域的向量空间模型应用于话题识别与追踪,并在后续研究中进行了系列改进,目前,大多数研究者均采用向量空间模型进行话题建模。

    贝叶斯网络是人工智能领域处理不确定性问题的主要方法,作为概率模型的扩展,在过去几十年已经成功应用于信息检索领域。信念网络模型是基于贝叶斯网络的信息检索模型的一种,它提出了一个有效的推理机制,可以模拟向量空间模型、概率模型和推理网络模型。向量空间模型在话题识别与追踪领域的成功应用从理论上验证了信念网络亦可应用于话题识别与追踪,但该研究在国内外尚属空白,论文试图将信息检索领域的信念网络应用于话题识别与追踪,构建基于信念网络的话题识别与追踪模型,为该领域提出新的突破。话题识别与追踪的应用领域要求系统在达到查全任务的前提下,尽可能提高系统的查准率,为此,文章通过分析话题本身的特点以及造成系统误报的原因,提出基于信念网络的话题识别与追踪优化,优化措施涉及时序权重、误报检测、符合话题特点的特征提取。