[1]刘竹松,陈洁.考虑数据不确定性的非均匀挖掘算法[J].华侨大学学报(自然科学版),2016,37(3):308-311.[doi:10.11830/ISSN.1000-5013.2016.03.0308]
 LIU Zhusong,CHEN Jie.Non-Uniform Mining Algorithm forConsidering Data Uncertainty[J].Journal of Huaqiao University(Natural Science),2016,37(3):308-311.[doi:10.11830/ISSN.1000-5013.2016.03.0308]
点击复制

考虑数据不确定性的非均匀挖掘算法()
分享到:

《华侨大学学报(自然科学版)》[ISSN:1000-5013/CN:35-1079/N]

卷:
第37卷
期数:
2016年第3期
页码:
308-311
栏目:
出版日期:
2016-05-09

文章信息/Info

Title:
Non-Uniform Mining Algorithm forConsidering Data Uncertainty
文章编号:
1000-5013(2016)03-0308-04
作者:
刘竹松 陈洁
广东工业大学 计算机学院, 广东 广州 510006
Author(s):
LIU Zhusong CHEN Jie
School of Computer Science and Technology, Guangdong University of Technology, Guangzhou 510006, China
关键词:
高维大数据 数据挖掘 模糊逻辑 不确定频繁模式树 区域连接演算
Keywords:
high dimensional data data mining fuzzy logic uncertain frequent pattern tree region connection calculus
分类号:
TP311.13
DOI:
10.11830/ISSN.1000-5013.2016.03.0308
文献标志码:
A
摘要:
针对高维大数据不确定性的非均匀挖掘问题,提出一种基于不确定频繁模式树的模糊逻辑非均匀数据挖掘算法.首先,在考虑数据不确定性的前提下建立高维数据的区域连接演算(RCC)模型,并基于数据集合组元定义分析不确定数据集合的模糊距离;然后,采用不确定模式树对数据的非均匀特性进行均匀泛化处理,并给出了具体的实现步骤.仿真结果表明:文中方法有效地提升不确定非均匀数据集合在不同支持度情况下的挖掘效率.
Abstract:
In order to solve high-dimensional large data uncertainty and non-uniform mining problems, this paper proposed a new kind of non-uniform data mining algorithm based on the fuzzy logic and uncertain frequent pattern tree. Firstly, the high-dimensional region connection calculus(RCC)data model is established under the premise of considering the data uncertainty. The uncertain fuzzy distance of data sets is defined and analyzed based on the data sets elements. Secondly, the non-uniform data is generalized by the uncertain frequent pattern tree, and the specific implementation steps is given. Simulation results show that the proposed method effectively improved the mining efficiency of the uncertain heterogeneous data sets in different support conditions.

参考文献/References:

[1] 喻小光,陈维斌,陈荣鑫.一种数据规约的近似挖掘方法的实现[J].华侨大学学报(自然科学版),2008,29(3):370-374.
[2] 朱龙.利润约束的关联规则挖掘算法[J].华侨大学学报(自然科学版),2015,36(5):522-526.
[3] 吴章玲,金培全,岳华丽,等.基于PCM的大数据存储与管理研究[J].计算机研究与发展,2015,52(2):343-361.
[4] ELISEO C,FELICE P D.Mining multiple-level spatial association rules for objects with a broad boundary[J].Data and Knowledge Engineering,2000,34(3):251-270.
[5] 王珊,王会举,覃雄派.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):174-181.
[6] SHIFEI D,FULIN W,JUN Q,et al.Research on data stream clustering algorithms [J].Artificial Intelligence Review,2013,43(4):593-600
[7] 张继福,李永红,秦啸,等.基于MapReduce与相关子空间的局部离群数据挖掘算法[J].软件学报,2015,26(5):1079-1095.
[8] 刘大有,王生生,虞强源.基于定性空间推理的多层空间关联规则挖掘算法[J].计算机研究与发展,2004,41(4):565-570.
[9] JONATHAN A S,ELAINE R F,RODRIGO C B,et al.Data stream clustering: A survey[J].ACM Computing Surveys,2013,46(1):1-13,31.
[10] 李洁,高新波,焦李成.一种基于 GA 的混合属性特征大数据集聚类算法[J].电子与信息学报,2004,26(8):1203-1209.
[11] 任家东,王倩,王蒙.一种基于频繁模式有向无环图的数据流频繁模式挖掘算法[J].燕山大学学报(自然科学版),2011,35(2):115-120.
[12] 陈爱东,刘国华,费凡,等.满足均匀分布的不确定数据关联规则挖掘算法[J].计算机研究与发展,2013,50(增刊1):186-195.
[13] 雷向欣,杨智应,黄少寅,等.XML数据流分页频繁子树挖掘研究[J].计算机研究与发展,2012,49(9):1926-1936.
[14] 孙力娟,陈小东,韩崇,等.一种新的数据流模糊聚类方法[J].电子与信息学报,2015,37(7):1620-1625.

相似文献/References:

[1]郑荣宝,卢润开,唐晓莲,等.1998-2016年全球LUCC研究进展与热点分析[J].华侨大学学报(自然科学版),2017,38(5):591.[doi:10.11830/ISSN.1000-5013.201706068]
 ZHENG Rongbao,LU Runkai,TANG Xiaolian,et al.Researches Progress and Hotspots Analysis of Global LUCC Research During 1998 to 2016[J].Journal of Huaqiao University(Natural Science),2017,38(3):591.[doi:10.11830/ISSN.1000-5013.201706068]
[2]陈远杰,余劲松弟,佟瑞菊.运用覆盖模型的遥感时序数据Web互操作[J].华侨大学学报(自然科学版),2018,39(6):899.[doi:10.11830/ISSN.1000-5013.201711019]
 CHEN Yuanjie,YU Jinsongdi,TONG Ruiju.Remote Sensing Time-Series Data Web Interoperability Using Coverage Model[J].Journal of Huaqiao University(Natural Science),2018,39(3):899.[doi:10.11830/ISSN.1000-5013.201711019]
[3]郭宇红,童云海.隐私保护频繁项集挖掘中的分组随机化模型[J].华侨大学学报(自然科学版),2020,41(2):230.[doi:10.11830/ISSN.1000-5013.201911025]
 GUO Yuhong,TONG Yunhai.Grouping Randomized Model in Privacy Preserving Frequent Item Set Mining[J].Journal of Huaqiao University(Natural Science),2020,41(3):230.[doi:10.11830/ISSN.1000-5013.201911025]

备注/Memo

备注/Memo:
收稿日期: 2016-03-18
通信作者: 刘竹松(1979-),男,副教授,博士,主要从事云计算、大数据的研究.E-mail:liuzs@gdut.edu.cn.
基金项目: 国家自然科学基金资助项目(61572144); 广东省科技计划项目(2013B090200006); 广东省现代信息服务业发展专项基金资助项目(GDEID2011IS022)
更新日期/Last Update: 2016-05-20