数据分析学习路线

数据分析由三大重要部分组成:

  1.数据采集。它是我们的原材料,因为任何分析都是需要数据源;

  2.数据挖掘。它可以说是最“高大上”的部分,也是整个商业价值所在。数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能BI

  3.数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观的了解到分析数据的结果。

 

下面总结详解这三大部分的内容:

一 数据采集

  采集工具:八爪鱼,自动抓取的神器,它可以帮你抓取 99% 的页面源。

  python爬虫:可编写,采集,存储数据,以及自动化采集设计。

 

 

 

 

 

 

 

 

 

 

 

二数据挖掘

  它可以说是知识型的工程,相当于整个专栏中的“算法”部分。首先要知道他的基本流程,算法,以及底层的数学基础。

  基本流程:商业理解,数据理解,数据准备,模型建立,模型评估,上线发布

  算法:分类算法,聚类算法,关联分析,连接分析

  数学基础:概率论和数据统计,线性代数,图论,最优化方法

   

 

三数据可视化

  当数据量大的时候很难理解,可视化可以帮我们很好地理解这些数据的结构,以及分析结果的视觉呈现。

  数据可视化有两种方法(并不是全部):

  1.python第三方库:Matplotlib,Seaborn等

  2.第三方工具:如果生成了csv格式文件,想要采用所见即得的方式进行呈现,可以采用微图,DataV,Data GIF Maker等第三方工具。

 

 

 

转载于:https://www.cnblogs.com/HugJun/p/11090141.html

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值