| ISBN/价格: | 978-7-01-014847-2:CNY38.00 |
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 海量网络学术文献自动分类研究/.王效岳,白如江等著 |
| 出版发行项: | 北京:,人民出版社:,2015 |
| 载体形态项: | 10,245页:;+图:;+23cm |
| 一般附注: | 国家社会科学基金项目“海量网络学术文献自动分类研究”、教育部人文社会科学研究一般项目“基于本体集成的文本分类关键技术研究”、山东理工大学人文社会科学发展基金项目资助 |
| 提要文摘: | 本书综合运用情报分析、自然语言处理和大数据技术,为网络上离散分布的海量学术文献提供了新的知识组织解决方案:首先,研究了利用Heritrix网络爬虫对网络中的学术文献资源进行抓取;其次,提出了一种基于本体集成的语义文本分类方法,该方法解决了本体概念与自然语言词汇之间抽象性与具体性、普遍性与特殊性的矛盾,最大限度地利用了文献中的语义信息,有效地提升了分类的准确性;再次,利用Hadoop平台设计了基于MapReduce计算模型的并行分类方法,使得文本自动分类效率明显提升;最后,实现了海量学术文献获取和自动分类原型系统,验证了前期所做研究的可行性。 |
| 题名主题: | 计算机网络 信息检索 研究 |
| 中图分类: | G254.92 |
| 个人名称等同: | 王效岳 著 |
|---|
| 个人名称等同: | 白如江 著 |
| 记录来源: | CN SDL 20200706 |