数据分析（一）：数据的获取、存储、清洗

最新推荐文章于 2024-01-07 02:04:47 发布

Zlbbbbbbo

最新推荐文章于 2024-01-07 02:04:47 发布

阅读量1.2k

点赞数

文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zlbbbbbbo/article/details/131062613

版权

逻辑路线：

在进行数据分析前，必然得先获得数据；
获得数据之后，考虑将数据存储在何处；
存储数据后，需要将数据整理成期望的格式、排除一些异常

1）数据的获取

数据的获取其实才是最重要的环节，没有数据后续的处理分析也无从谈起；

数据往往属于保密内容，所以想要获得他人的数据，难度很大；

内部数据通常依赖其他部门提供，倘若没有专门的数据/运营部门来收集管理数据，也很难获得正确、完整的数据；并且涉及到跨部门合作沟通，经常效率不高，属于费力不讨好的事情。

综上，数据的收集和获取绝不是容易的事。

目前有以下几种数据的获取方法，或者说数据来源：

内部建立的数据库。高度依赖于企业的建设，还有待完善。
第三方数据机构提供，包含数据公司、行研咨询公司。费用昂贵。
爬虫。灰色地带，各大网站的反爬机制越来越完善，技术难度高。

2）数据的存储

常见的容器：Excel、各种数据库（SQL、Access）、SPSS、云服务器

对不同的存储方式，采用合适的清洗方式和工具

3）数据的清洗

数据清洗一般包括：提取、去重、缺失、格式

提取需要的数据指标
去除重复的数据
有些数据缺失，考虑填充或者舍弃
把数据改成易于处理的格式，例如时间、日期

使用的工具：Excel函数操作、Excel Query操作、SQL语言、Python的Pandas库中的方法

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据分析（一）：数据的获取、存储、清洗

关于数据获取、存储、清洗的一些总结思考
复制链接

扫一扫

Zlbbbbbbo CSDN认证博客专家 CSDN认证企业博客

码龄5年

8: 原创

161万+: 周排名

184万+: 总排名

3988: 访问

: 等级

86: 积分

2: 粉丝

2: 获赞

3: 评论

8: 收藏

私信

关注

热门文章

分类专栏

供应链管理 3篇

最新评论

产品经理 | 《结网》
CSDN-Ada助手: 恭喜您撰写了第8篇博客，题为“产品经理 | 《结网》”。看到您的持续创作，我不禁为您感到鼓舞。通过这篇博客，您以产品经理的视角分享了《结网》的见解，为读者提供了有价值的内容。在下一步的创作中，我建议您可以更深入地探讨《结网》这个主题，或者从不同的角度分析产品经理的角色与挑战。您可以考虑分享一些实际案例，以便读者更好地理解产品经理在现实工作中的应对策略。同时，您也可以借助一些图表或数据来支撑您的观点，使文章更具说服力。总之，您已经做得非常出色了，希望您能继续保持创作的热情，并不断挖掘更多有价值的内容与读者分享。期待您的下一篇博客！
数据分析（三）：数据可视化
CSDN-Ada助手: 恭喜您写了第6篇博客，标题为“数据分析（三）：数据可视化”。非常感谢您分享这些有价值的内容，对于我们这些初学者来说，您的博客真的很有用。希望您能继续保持创作，分享更多有关数据分析的知识。下一步的创作建议，可以考虑介绍一些实用的数据可视化工具和技巧，让我们更好地理解和分析数据。再次感谢您的分享。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
人人都是产品经理（入门版）
CSDN-Ada助手: 恭喜您写了一篇很棒的入门版博客，帮助大家更好地了解产品经理。接下来建议您可以从实践中总结经验，分享给读者们，更好地帮助他们成为优秀的产品经理。期待您的下一篇作品。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。