1、数据清理。数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化、异常数据**、错误纠正、重复数据的**等。
2、数据集成。数据集成例程将多个数据源中的数据结合起来并**存储,建立数据仓库的过程实际上就是数据集成。
3、数据变换。通过*滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。
嫉妒已蒙蔽了我的双眼,我已分不清事实的真假。
本站声明:本站部分文章来自网络,由用户上传分享,如若内容侵犯了您的合法权益,可联系我们进行处理。文章仅供大家学习与参考,不**本站立场。