数据分析
文章平均质量分 77
hl_zmfh
这个作者很懒,什么都没留下…
展开
-
Python泰坦尼克号生存概率分析
本项目在Kaggle中是数据分析入门项目,如果你想了解数据分析,我们就从这里开始吧!数据集可以到Kaggle入门项目中直接找到,下载即可!1.提出问题什么样的人在泰坦尼克号中更容易存活?2.采集数据、理解数据导入数据分析工具库Numpy、Pandas用pandas中的read_csv()方法读取格式为CSV的数据集ps:本项目涉及到机器学习,所以我们有2个数据集,一个训练数据集,...原创 2018-10-18 12:24:15 · 3325 阅读 · 0 评论 -
Python北京二手房房价数据集分析
本次分析的数据集来源为链家2017年房源信息。在数据分析的过程中,我们也可以先去理解数据,再提出问题,在探索数据的过程当中,我们往往会发现很多有趣的事情~1.提出问题北京二手房的房价跟哪些因素有关呢?2.读取数据,理解数据导入数据分析相关工具包%matplotlib 为魔法函数,之后的数据可视化过程中,有了它我们就不需要每次都使用plt.show()来显示图表了。用pandas中的...原创 2018-10-18 14:20:32 · 8493 阅读 · 49 评论 -
Python人力资源员工离职原因数据分析
本项目的数据集来源kaggle竞赛项目:HR-Analytics,自行下载即可!1.提出问题公司当中员工们离职的原因是什么?什么样的员工会离职呢?2.读取数据,理解数据导入数据分析工具包,这次我们用seaborn库来优化我们的数据可视化图表!读取数据查看数据,head()方法没有指定默认查看前5行查看数据是否存在缺失值以及数据类型查看数据集是否有异常值综上:本数据集有...原创 2018-10-18 18:31:51 · 10640 阅读 · 4 评论