[1]辛欣,陈曙东,仝明磊,等.采用潜在概率语义模型和K近邻分类器的音频分类算法[J].华侨大学学报(自然科学版),2016,37(2):196-200.[doi:10.11830/ISSN.1000-5013.2016.02.0196]
 XIN Xin,CHEN Shudong,TONG Minglei,et al.Audio Classification Algorithm Using Probabilistic Latent Semantic Models and K Nearest Neighbor Classifier[J].Journal of Huaqiao University(Natural Science),2016,37(2):196-200.[doi:10.11830/ISSN.1000-5013.2016.02.0196]
点击复制

采用潜在概率语义模型和K近邻分类器的音频分类算法()
分享到:

《华侨大学学报(自然科学版)》[ISSN:1000-5013/CN:35-1079/N]

卷:
第37卷
期数:
2016年第2期
页码:
196-200
栏目:
出版日期:
2016-03-20

文章信息/Info

Title:
Audio Classification Algorithm Using Probabilistic Latent Semantic Models and K Nearest Neighbor Classifier
文章编号:
1000-5013(2016)02-0196-05
作者:
辛欣13 陈曙东23 仝明磊4 胡文皓13 刘陈伟13 葛浩栋3
1. 中国科学院大学 电子电气与通信工程学院, 北京 100049;2. 中国科学院微电子研究所, 北京 100029;3. 中国物联网研究发展中心, 江苏 无锡 214135;4. 上海电力学院 电子与信息工程学院, 上海 200090
Author(s):
XIN Xin13 CHEN Shudong23 TONG Minglei4 HU Wenhao13 LIU Chenwei13 GE Haodong3
1. School of Electronic, Electrical and Communication Engineering, University of Chinese Academy of Sciences, Beijing 100049, China; 2. Institute of Microelectronics, Chinese Academy of Sciences, Beijing 100029, China; 3. China R& D Center for Interne
关键词:
梅尔频率倒谱系数 词-频共现矩阵 声音主题词袋模型 潜在概率语义模型 K近邻分类器
Keywords:
Mel frequency cepstral coefficients word-frequency of co-occurrence matrix bag of sound frames models probabilistic latent semantic analysis model K-nearest neighbor classifiers
分类号:
TP391
DOI:
10.11830/ISSN.1000-5013.2016.02.0196
文献标志码:
A
摘要:
提出一种基于潜在概率语义(PLSA)模型和K近邻分类器的音频分类算法.首先,将信号特征向量送入潜在概率语义模型中训练,获得声音主题词袋模型;然后,使用K近邻分类器(KNN)进行分类.实验结果表明:与传统的K近邻分类算法相比,提出的算法在分类效果上有较明显的改善.
Abstract:
The paper proposed an audio classification algorithm based on probabilistic latent semantic analysis model(PLSA)and K-nearest neighbor classifiers(KNN). The algorithm first feed the audio signal feature vector into the PLSA model training to get a bag of sound frames models, then classify with the KNN classifier. Experimental results showed that the proposed classification algorithm has better classification effect compared with the traditional KNN algorithm.

参考文献/References:

[1] RADHAKRISHNAN R,DIVAKARAN A.Systematic acquisition of audio classes for elevator surveillance[C]//SPIE Image and Video Communications and Processing.San Jose:[s.n.],2005:64- 71.
[2] ATREY P K, MADDAGE N C, KANKANHALLI M S. Audio based event detection for multimedia surveillance[C]//International Conference on Acoustics, Speech and Signal Processing.Toulouse:IEEE Press,2006:3-5.
[3] AUCOUTURIER J J.The bag-of-frames approach to audio pattern recognition: A sufficient model for urban sound scapes but not for polyphonic music [J].Journal of Acoustical Society of America,2007,122(2):881-891.
[4] 冀中.面向新闻视频内容分析的音频分层分类算法[J].计算机应用研究,2009,26(5):1673-1675.
[5] ZENG Zhi,ZHANG Shuwu.A novel approach to musical genre classification using probabilistic latent semantic analysis model[C]//International Conference on Multimedia and Expo.New York:IEEE Press,2009:486- 489.
[6] 容宝华.基于最小距离的音频分类方法的研究[J].电声技术,2012,36(11):46-51,65.
[7] 张宝印.面向情感的电影背景音乐分类分类方法研究[D].武汉:华中科技大学,2011:26.
[8] 石晶,戴国忠.基于PLSA模型的文本分割[J].计算机研究与发展,2007,44(2):242-248.
[9] 李航.统计学习方法[M].北京:清华大学出版社,2013:37-40.
[10] 郭金玲,王文剑.一种基于数据分布的SVM核选择方法统计学习方法[J].华侨大学学报(自然科学版),2013,34(5):525-528.

备注/Memo

备注/Memo:
收稿日期: 2015-09-18
通信作者: 陈曙东(1977-),女,研究员,博士,主要从事大数据管理的研究.E-mail:chenshudong@ciotc.org.
基金项目: 江苏省基础研究计划(自然科学基金)面上项目(BK20141116)
更新日期/Last Update: 2016-03-20