毕业论文

当前位置: 毕业论文 > 计算机论文 >

中文微博用户标签的自动生成研究

时间:2017-08-12 15:13来源:毕业论文
论文采用的数据是北京理工大学所采集的新浪微博的数据,处理过程的第一步是将原始数据导入到数据库中,并将每个用户的所有微博数据结合起来,第二步,通过复旦大学的关键词提
摘要随着信息化时代的发展,信息量不断增加,这就增加了人们在信息检索过程中的难度,所以我们对新的,更高效的信息检索方法的需求与日俱增,其中信息检索过程中最关键的,也是最基本的一个步骤就是关键词的提取,由于微博是目前新产生的,并且应用量非常大的一个信息发布工具 ,所以目前对微博的研究呈快速上升趋势。本文的目的是通过新浪微博来研究针对每位微博用户的关键词的自动提取,希望能在微博关键词的应用领域做一定的铺垫。
    本毕业论文采用的数据是北京理工大学所采集的新浪微博的数据,处理过程的第一步是将原始数据导入到数据库中,并将每个用户的所有微博数据结合起来,第二步,通过复旦大学的关键词提取的开源软件对每位微博用户的所有微博进行关键词提取,第三步,提取部分有自己提取的关键词的用户并将其提取的关键词与机器提取的关键词进行对比并统计分析,分析机器提取结果的召回率和准确率。希望此次研究能够对微博的关键词提取的进一步改进提供帮助,并希望以后有越来越多的人能够关注此领域,为关键词提取领域的技术发展提供动力。12378
关键词  微博 关键词提取 新题提取 Title  Mining Social Tagging System——Automatic generation of the Chinese micro-blog
Abstract
With the development of the information age, the amount of information increasing, it increases the difficulty in the information retrieval process, so the needs of new, more efficient information retrieval method grows with each passing day, in the information retrieval process the most critical, most basic one step is the keyword extraction, since the micro-blog is a new generated and have a large amount of users, so the research to micro-blog is a rapidly upward trend, and is very hot in the field of information technology, so we grasp the trend, in this paper we make the micro-blog as the research object, research the technologies in keywords extraction of micro-blog,I hope this could do some help to micro-blog technology, and can promote the further development of the information technology field. 源自六&维"论*文'网.加7位QQ3249'114 www.lwfree.cn
  The date used in this page is the micro-blog date of sina that catched by Beijing University of Science and Technology.The first step of the processing is to import the date into the datebase,and join every users’
micro-blog date.The second step of the processing is to distract the key-words of every user using the open resource key-word-extracting software of Fudan.The last step is to compare the key-words that the users extract themselves with the key-words that extracted by the machine and then anylise the recall-rate and the accuracy-rate.I wish this page could do some help to the micro-blog keyword extraction field,and I wish in the future there will be more and more people could be interested in this field,to serve their power and put forward the keyword extraction technology.
Keywords:  micro-blog, keyword extraction,  information extraction
 目  次
1  前言    1
2  研究综述    1
2.1  社会化标签和标签系统概述    1
2.1.1  社会化标签    1
2.1.2  标签系统    2
2.2  标签生成方面的研究    2
2.3  社会标注的应用    3
3  系统设计与关键技术说明    3
3.1  系统设计    4
3.2  关键技术说明    5
3.2.1  数据的初步处理    5
3.2.2  关键词的提取    5
4  结果分析    7
4.1  系统展示及提取结果    7
4.2  关键词提取结果分析    9 中文微博用户标签的自动生成研究:http://www.lwfree.cn/jisuanjilunwen/20170812/12124.html
------分隔线----------------------------
推荐内容