数据分析
EarlZed
这个作者很懒,什么都没留下…
展开
-
Python数据分析_Pandas入门_探索2012欧洲杯数据- Euro2012
2012欧洲杯数据背景Pandas练习题第二个数据集,题目里做法比较简单,试图提供一个新的探索步骤导入数据数据基本信息查各列数据的皮尔逊相关系数选取Goals相关度最高的其他列由于进球数是球场最重要的数据之一,尝试探索到底是什么因素对进球数影响最大呢选择相关度高的列可以看到,Passes(过人)与 Touches(触球数)对Goals(进球数)有比较明显的影响。对G...原创 2019-09-12 00:38:54 · 4221 阅读 · 1 评论 -
Python数据分析_Pandas入门_Chipotle快餐数据分析
背景科赛网“Pandas做数据分析”数据集,进行探索分析代码首先,导入数据集,查看数据背景科赛网“Pandas做数据分析”数据集,进行探索分析代码首先,导入数据集,查看数据查看不同item的购买数量不同item出现的次数统计对price进行处理增加“sub_total”列,查看每笔订单的总金额查看总收入是多少数据集中“choice_description”,猜...原创 2019-09-08 21:00:21 · 2755 阅读 · 1 评论 -
Python数据分析_Pandas入门_探索酒类消费数据_Drinks
背景Pandas练习题第三个数据集,寻找新的视角看数据步骤导入数据以大洲为组进行分类,查看均值对数据进行可视化从图中明显可以看出:欧洲的酒类消费需求最多,啤酒、白酒、红酒和每升酒精含量均值均为最高中美、南美洲啤酒、白酒消费需求较多,对红酒消费需求较少大洋洲消费结构与美洲相似,但消费需求较少非洲对啤酒需求要远高于白酒、红酒,整体消费需求较少亚洲由于传统文化影响,白酒需求最高...原创 2019-09-15 18:45:15 · 4342 阅读 · 0 评论 -
Python数据分析_美国犯罪数据_US_Crime_Rates EDA.csv
背景Pandas练习题第四个数据集,寻找新的视角看数据步骤导入数据将Year的数据类型转换为 datetime64将Year设置为DataFrame的索引对Year进行resample,并进行汇总计算各种类犯罪在总人口中的占比单纯的犯罪数量,没有比较没有占比几乎没有意义,所以这里计算占比对各类数据占比进行可视化从1960到2010期间,整体犯罪呈先上升后下降的趋势,80年代...原创 2019-09-16 22:56:15 · 6348 阅读 · 5 评论 -
Python 机器学习:泰坦尼克号获救预测_Titanic
问题数据来源于Kaggle,通过一组列有泰坦尼克号灾难幸存者或幸存者的训练样本集,我们的模型能否基于不包含幸存者信息的给定测试数据集确定这些测试数据集中的乘客是否幸存。...原创 2019-09-19 23:33:10 · 2013 阅读 · 1 评论