杨宗凯:一种基于样本空间动态划分的中文情感识别方法
【作者】 刘智; 杨宗凯; 刘三(女牙); 铁璐;
【Author】 LIU Zhi,YANG Zong-kai,LIU San-ya,TIE Lu (National Engineering Research Center for E-Learning,Huazhong Normal University,Wuhan 430079,China)
【机构】 华中师范大学国家数字化学习工程技术研究中心;
【摘要】 为了提高中文文本情感识别的精度,从集成学习的角度出发,提出了一种基于样本空间动态划分的机制构建文本情感分类器。该算法充分利用训练样本空间内的鉴别信息,通过引入核平滑方法对样本空间进行自适应划分,形成若干个具有差异性的多粒度样本子集,然后分别在每个子集上构造基分类器,最后将所有基分类器的输出进行融合以产生最终的预测结果。实验结果表明,该算法在查准率和查全率等方面均优于Bagging、AdaBoost等算法,并且在大规模样本集的情感识别中具有良好的应用前景。 更多还原
【关键词】 文本情感识别; 样本子空间; 动态划分; 集成分类模型; 核平滑;
【文内图片】
初始训练种子数b与子空间数量L对RDS算法识别性能的影响初始训练种子数b与子空间数量L对RDS算法识别性能的影响【基金】 国家“核高基”重大专项基金资助项目(2010ZX01045-001-005);国家“十二五”科技支撑计划资助项目(2011BAK08B03);国家教育部新世纪优秀人才支持计划资助项目(NCET-11-0654);华中师范大学中央高校基本科研业务费专项基金资助项目(CCNU09A02006)
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性质的教育和科研之目的,并不意味着赞同其观点或者证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。