[1]寸待杰,刘韶涛.采用内容挖掘的缅甸文字相似文档检索[J].华侨大学学报(自然科学版),2013,34(5):521-524.[doi:10.11830/ISSN.1000-5013.2013.05.0521]
 CUN Dai-jie,LIU Shao-tao.Retrieval of the Most Similar Myanmar Document Using Content Mining[J].Journal of Huaqiao University(Natural Science),2013,34(5):521-524.[doi:10.11830/ISSN.1000-5013.2013.05.0521]
点击复制

采用内容挖掘的缅甸文字相似文档检索()
分享到:

《华侨大学学报(自然科学版)》[ISSN:1000-5013/CN:35-1079/N]

卷:
第34卷
期数:
2013年第5期
页码:
521-524
栏目:
出版日期:
2013-09-20

文章信息/Info

Title:
Retrieval of the Most Similar Myanmar Document Using Content Mining
文章编号:
1000-5013(2013)05-0521-04
作者:
寸待杰 刘韶涛
华侨大学 计算机科学与技术学院, 福建 厦门 361021
Author(s):
CUN Dai-jie LIU Shao-tao
College of Computer Science and Technology, Huaqiao University, Xiamen 361021, China
关键词:
缅甸文字 文本挖掘 向量空间模型 信息检索 Okapi相似度
Keywords:
Myanmar word text mining vector space model text retrieval Okapi similarity
分类号:
TP311
DOI:
10.11830/ISSN.1000-5013.2013.05.0521
文献标志码:
A
摘要:
对缅甸文字进行文本挖掘,提出一种新的缅甸文字单字分割算法和词干提取算法.在向量空间模型下,使用Okapi相似度评测方法,评测缅甸文字文档与查询关键字之间的相关性,实现一个基于以上算法的缅甸文字文献检索系统.实验结果证明:所提出来的算法能够快速、有效地挖掘Web上的Html文档.
Abstract:
Propose a new algorithm of Myanmar word segmentation and Myanmar word stemming for Myanmar text mining. Under the vector space model, Okapi similarity method is used to evaluate the relationship between Myanmar text and the key words, consequently realize a Myanmar text retrieval system based on the algorithm above. The experimental results show that proposed by the algorithm can quickly and effectively mining the Html documents on the web.

参考文献/References:

[1] HTAY H H,MURTHY K N.Myanmar word segmentation using syllable level longest matching[D].Hyderabad:University of Hyderabad,2008:41-48.
[2] Government Myanmar Language Association. Myanmar grammar[M].Mandalay: Upper Myanmar Government Press,2011:1-97.
[3] 王梁.基于向量空间的信息检索算法研究[D].长春:长春理工大学,2009:1-37.
[4] 张筱丹.基于向量空间模型的Web文本自动摘要系统的研究[D].合肥:合肥工业大学,2009:1-41.
[5] 徐云青,徐义峰,李舟军.基于VSM的中文信息检索[J].计算机系统应用,2007(4):21-23.
[6] 胡晓,王理,潘守慧.基于改进VSM的Web文本分类方法[J].情报杂志,2010,29(5):144-147.
[7] 蒋子龙,高曙.基于向量空间模型的Web服务描述相似度计算的研究与实现[J].咸阳师范学院学报,2007,22(6):52-54,57.
[8] 赵耀红.基于向量空间模型的信息检索系统的研究与实现[J].长春大学学报,2009,19(8):25-27,31.
[9] 王晓黎,王文杰.基于向量空间模型的文本检索系统[J].微电子学与计算机,2006,23(6):188-190.
[10] LIU Bing.Web data mining exploring hyperlinks, contents and usage data[M].Chicago:Springer,2007:183-195.

相似文献/References:

[1]韩文智.计算机文本信息挖掘技术在网络安全中的应用[J].华侨大学学报(自然科学版),2016,37(1):67.[doi:10.11830/ISSN.1000-5013.2016.01.0067]
 HAN Wenzhi.Application of Computer Text Information Mining Technology in Network Security[J].Journal of Huaqiao University(Natural Science),2016,37(5):67.[doi:10.11830/ISSN.1000-5013.2016.01.0067]

备注/Memo

备注/Memo:
收稿日期: 2012-10-27
通信作者: 刘韶涛(1969-),男,副教授,主要从事软件体系结构与软件复用的研究.E-mail:shaotaol@hqu.edu.cn.
基金项目: 中央高校基本科研业务费专项基金资助项目, 国务院侨办科研基金资助项目(09QZR02)
更新日期/Last Update: 2013-09-20