大数据的数据处理一共包括四个方面分别是收集,存储,变形,和分析。
收集:原始数据种类多样,格式、位置、存储、时效性等迥异。数据收集从异构数据源中收集数据并转换成相应的格式方便处理。
存储:收集好的数据需要根据成本、格式、查询、业务逻辑等需求,存放在合适的存储中,方便进一步的分析。
变形:原始数据需要变形与增强之后才适合分析,比如网页日志中把IP地址替换成省市、传感器数据的纠错、用户行为统计等。
分析:通过整理好的数据分析whathappened、whyithappened、whatishappening和whatwillhappen,帮助企业决策。
永远的绿树和久违的阳光,越来越舍不得这里。
本站声明:本站部分文章来自网络,由用户上传分享,如若内容侵犯了您的合法权益,可联系我们进行处理。文章仅供大家学习与参考,不**本站立场。