在线刊号(2320-9801)印刷刊号(2320-9798)
改进聚类公式以减少数据挖掘中的异常值
现有的数据挖掘研究大多集中在单聚类算法对数据的离群点检测上。在数据挖掘中,有很多方法可以通过将数据聚类来检测离群值,然后从中检测离群值。其中离群值是数据项的值超出样本数据的范围,这可能是异常数据。本文提出了一种既适用于数值数据又适用于文本数据的混合算法。我们的重点是改进聚类的生成,以减少异常值的数量,因为我们可以结合数据挖掘的聚类和分类技术,即加权k均值和神经网络。
Nancy Lekhi, Manish Mahajan
阅读全文下载全文|访问全文