K Means算法在大数据集上的性能优化研究

Journal: Advances in Computer and Autonomous Intelligence Research DOI: 10.12238/acair.v2i2.7403

姜智宇

中国联通哈尔滨软件研究院

Abstract

本文旨在深入研究K Means算法在大数据集上的性能优化方法,以提高其在大规模数据处理中的效率和准确性。通过理论分析,本文将探讨如何优化K Means算法,解决其在大数据集上面临的挑战,以满足当前大数据时代对高效数据聚类的需求。文章将关注性能优化的基本原理、实际方法,旨在为K Means算法在大规模数据处理中提供创新的研究成果。

Keywords

K Means算法;大数据集;性能优化;聚类效果;计算效率

References

[1] 郑佳炜,唐厂.自适应样本和特征加权的k-means算法[J].计算机应用,2023,43(S2):99-104.
[2] 常荣,徐敏.基于改进K-Means和DNN算法的电力数据异常检测[J].南京理工大学学报,2023,47(06):790-796+858.
[3] 宗嵩,曾维才,陈志勇,等.基于K-means算法和积灰损耗系数的中国西北地区光伏电站清洗策略建模分析[J].太阳能,2023,(12):67-73.
[4] 陈建娇.高维数据的K-harmonic Means聚类方法及其应用研究[D].上海大学,2012.

Copyright © 2024 姜智宇

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License