Pandas+Numpy+Matplotlib,Python数据分析从入门到进阶

个人介绍

 

大家好,我是一名双非学校、本硕连读的统计学专业毕业生,现就职于一家互联网公司。今天我与大家分享一下我的 “数据分析” 学习之路和收藏的学习资料,希望大家看以后能有所收获。

其实,我的数据分析之路也并非一路顺风。在外人看来,我统计学专业将来从事数据分析行业,可以算是科班出生,优势巨大。其实不然,学校课程和现实之间真的有很大一段距离!

工具方面,我们没有专门学 Excel,没有学SQL,更没有学习Python,学习的都是一些社会上不常使用的Eviews、Matlab工具,唯一有点用的就是SPSS,还不太精通。

业务能力就更别谈,我们几乎接触不到这些东西,拿到数据我们也是无从下手,不知道从何开始,唯一比你们懂一些的就是统计学知识了。

仅靠一点统计学知识,我作为对口专业的学生在毕业找到一份工作,就已经很难,更别说那些想跻身于数分行业的其他人。

 

学习之旅

 

首先要明确,什么是数据分析呢?

数据分析是指在统计学理论的指导下,结合具体业务数据,对数据进行相关处理,发现背后隐藏的问题,帮助相关业务部分监控、分析、定位、解决问题。

综上所述:一个优秀的数据分析师,应该是技能、统计学、业务sense的综合反映。不管你将来是从事数分行业,还是跳槽或自学数据分析,这三个部分缺一不可。

那么,我们应该怎么去学习呢?

为了让大家更清楚的get到我的思路,我特地总结了一张思维导图给大家。

(点击查看高清大图)

同时我也将我以前学习过程中帮助比较大的资料(技能类、统计类、业务类)和直播课分享给大家,免费领取方式在下方。

扫码添加微信
即可免费领取资料包+直播课

最后补充一点:想快速学习数分领域知识,不妨先看几节靠谱的直播课了解当下最贴合实际的学习思路,确定自己的方向。

我给大家推荐一个内容涵盖量化交易、数据可视化、数据分析《3天数据分析训练营》,课程内容非常细致全面,更重要的是,真的是免费的哦!

课程内容

7月20日 20:00&数据可视化入门:

五个关键步骤 快速实现酷炫可视化

流程解析:5个关键步骤,掌握核心方法

过程处理:2个关键工具,提升工作效率

实战项目:二手车网站数据爬取+可视化

7月21日 20:00&数据可视化进阶

四个案例 实现交互式可视化报表

入门级图表:用Python快速实现

进阶交互图:股票价格趋势

地图效果图:销售数据汇总

动态趋势图:电商直播数据

7月22日 20:00&数据分析技能进阶:

90分钟,快速掌握高效数据分类方法

知识解析:了解贝叶斯算法的适用场景

业务实操:  手把手教学,如何高效数据分类

项目实战:利用健康指标,预测患病率

课程详情

本次训练营的授课老师——C9高校数据科学特邀讲师王冕老师他曾任一线互联网公司的数据架构工程师,线上线下累积15年教学经验,授课经验丰富。

他还拥有50多项国内外各大高校和互联网行业巨头颁发的数据分析、大数据和机器学习相关证书!

 

(微软/Cloudera/加州大学等各大机构颁发的相关证书)

课程方面,老师每天都会耐心地直播答疑!还有大厂实战案例助你提升视野,内容涵盖Python入门、数据可视化、数据分析,迅速提升你的专业能力,让你少走弯路,真正实现从入门到提升!

4步学会数据可视化,办公效率提高三倍

(更多精彩内容 等你解锁)

免费获取方式

扫码添加微信
即可免费领取直播课+资料包

最新数据分析资料包

但是,如果遇到一些环境配置,还有一些错误异常等bug,资料就显得不太够用,这时候还是需要找一个专业的老师,为我们特别讲解。所以不妨先听一听直播课,了解当下最贴合实际的学习思路,确定自己的方向

(记得添加小助手领资料喔,说不定你哪天就用上了)????

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,那我们开始吧。 首先,我们需要安装必要的库,包括numpypandasmatplotlib。你可以通过以下命令来安装: ``` pip install numpy pandas matplotlib ``` 接下来,我们需要获取数据。我们可以从58同城的房产页面上爬取数据。这里我们使用Python中的requests库和BeautifulSoup库来实现。 ```python import requests from bs4 import BeautifulSoup url = 'https://cd.58.com/ershoufang/' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'} r = requests.get(url, headers=headers) soup = BeautifulSoup(r.text, 'html.parser') house_list = soup.find_all('div', {'class': 'property_content'}) ``` 现在我们已经成功获取了房屋列表。接下来,我们需要将它们保存到一个数据框中,以便进行分析。 ```python import pandas as pd data = [] for house in house_list: title = house.find('h3').text.strip() info_list = house.find('div', {'class': 'property_des'}).find_all('p') area = info_list[0].text.strip() layout = info_list[1].text.strip() direction = info_list[2].text.strip() floor = info_list[3].text.strip() age = info_list[4].text.strip() price = house.find('div', {'class': 'property_price'}).find('p').text.strip() data.append({'title': title, 'area': area, 'layout': layout, 'direction': direction, 'floor': floor, 'age': age, 'price': price}) df = pd.DataFrame(data) ``` 现在我们已经成功将数据保存到一个数据框中。我们可以开始对数据进行分析了。 首先,我们可以查看数据的基本统计信息。 ```python print(df.describe()) ``` 接下来,我们可以绘制一个房价分布图,以了解房价的分布情况。 ```python import matplotlib.pyplot as plt plt.hist(df['price'], bins=20) plt.xlabel('Price') plt.ylabel('Count') plt.show() ``` 我们还可以绘制一个散点图,以了解房价与面积之间的关系。 ```python plt.scatter(df['area'], df['price']) plt.xlabel('Area') plt.ylabel('Price') plt.show() ``` 最后,我们可以绘制一个箱线图,以了解不同户型的房价分布情况。 ```python import seaborn as sns sns.boxplot(x='layout', y='price', data=df) plt.show() ``` 这样,我们就完成了58同城成都房价的数据分析

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值