[1]赵玮.采用机器学习的聚类模型特征选择方法比较[J].华侨大学学报(自然科学版),2017,38(1):105-108.[doi:10.11830/ISSN.1000-5013.201701020]
 ZHAO Wei.Comparison of Feature Selection Method of Clustering Model Using Machine Learning[J].Journal of Huaqiao University(Natural Science),2017,38(1):105-108.[doi:10.11830/ISSN.1000-5013.201701020]
点击复制

采用机器学习的聚类模型特征选择方法比较()
分享到:

《华侨大学学报(自然科学版)》[ISSN:1000-5013/CN:35-1079/N]

卷:
第38卷
期数:
2017年第1期
页码:
105-108
栏目:
出版日期:
2017-01-09

文章信息/Info

Title:
Comparison of Feature Selection Method of Clustering Model Using Machine Learning
文章编号:
1000-5013(2017)01-0105-04
作者:
赵玮
北京联合大学 应用科技学院, 北京 100101
Author(s):
ZHAO Wei
College of Applied Science and Technology, Beijing Union University, Beijing 100101, China
关键词:
特征选择 聚类模型 机器学习 递归特征消除算法 Boruta方法
Keywords:
feature selection clustering model machine learning recursive feature elimination algorithm Boruta method
分类号:
TP181
DOI:
10.11830/ISSN.1000-5013.201701020
文献标志码:
A
摘要:
针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势.
Abstract:
Targeting at problems during the feature selection process of machine learning clustering model, at first, it makes analysis on the applicability of the feature selection for clustering model and makes adjustment and improvement. Then makes feature selection algorithm design based on R language recursive feature elimination(RFE)feature selection method and Boruta feature selection method. At last, applying cluster interior validity indexes to analyze the optimization result of online brand loyalty clustering model, a further comparative study is made on the feature selection method. The results show that the Boruta feature selection method has more advantages.

参考文献/References:

[1] 钱彦江.大规模数据聚类技术研究与实现[D].成都:电子科技大学,2009:4-5.
[2] 汪永旗,王惠娇.旅游大数据的MapReduce客户细分应用[J].华侨大学学报(自然科学版),2015,36(3):292-296.
[3] 方匡南.基于数据挖掘的分类和聚类算法研究及R语言实现[D].广州:暨南大学,2007:78-84.
[4] 刘蓉,陈晓红.基于数据挖掘的移动通信客户消费行为分析[J].计算机应用与软件,2006,23(2):60-62.
[5] 卢运梅.SVM-RFE算法在数据分析中的应用[D].长春:吉林大学,2009:16-28.
[6] 王曰芬,章成志,张蓓蓓,等.数据清洗研究综述[J].情报分析与研究,2007(12):50-56.
[7] 周开乐,杨善林,丁帅,等.聚类有效性研究综述[J].系统工程理论与实践,2014,34(9):2417-2431.
[8] 胡勇.聚类分析结果评价方法研究[D].包头:内蒙古科技大学,2014:62-63.
[9] KANUNGO T,MOUNT D M.A local search approximation algorithm for k-means clustering[J].Computational Geometry,2004,28(2/3):89-112.
[10] ELKAN C.Using the triangle inequality to accelerate k-means[C]//Proceedings of the Twentieth International Conference on Machine Learning.Menlo Park:AAAI Press,2003:147-153.

备注/Memo

备注/Memo:
收稿日期: 2016-11-25
通信作者: 赵玮(1981-),女,讲师,博士,主要从事数据挖掘与数据分析、电子商务的研究.E-mail:yykjtzhaowei@buu.edu.cn.
基金项目: 北京市教委科研计划项目(KM201511417010)
更新日期/Last Update: 2017-01-20