自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Python 机器学习:泰坦尼克号获救预测_Titanic

问题数据来源于Kaggle,通过一组列有泰坦尼克号灾难幸存者或幸存者的训练样本集,我们的模型能否基于不包含幸存者信息的给定测试数据集确定这些测试数据集中的乘客是否幸存。...

2019-09-19 23:33:10 2000 1

原创 Python数据分析_美国犯罪数据_US_Crime_Rates EDA.csv

背景Pandas练习题第四个数据集,寻找新的视角看数据步骤导入数据将Year的数据类型转换为 datetime64将Year设置为DataFrame的索引对Year进行resample,并进行汇总计算各种类犯罪在总人口中的占比单纯的犯罪数量,没有比较没有占比几乎没有意义,所以这里计算占比对各类数据占比进行可视化从1960到2010期间,整体犯罪呈先上升后下降的趋势,80年代...

2019-09-16 22:56:15 6321 5

原创 Python数据分析_Pandas入门_探索酒类消费数据_Drinks

背景Pandas练习题第三个数据集,寻找新的视角看数据步骤导入数据以大洲为组进行分类,查看均值对数据进行可视化从图中明显可以看出:欧洲的酒类消费需求最多,啤酒、白酒、红酒和每升酒精含量均值均为最高中美、南美洲啤酒、白酒消费需求较多,对红酒消费需求较少大洋洲消费结构与美洲相似,但消费需求较少非洲对啤酒需求要远高于白酒、红酒,整体消费需求较少亚洲由于传统文化影响,白酒需求最高...

2019-09-15 18:45:15 4334

原创 Python数据分析_Pandas入门_探索2012欧洲杯数据- Euro2012

2012欧洲杯数据背景Pandas练习题第二个数据集,题目里做法比较简单,试图提供一个新的探索步骤导入数据数据基本信息查各列数据的皮尔逊相关系数选取Goals相关度最高的其他列由于进球数是球场最重要的数据之一,尝试探索到底是什么因素对进球数影响最大呢选择相关度高的列可以看到,Passes(过人)与 Touches(触球数)对Goals(进球数)有比较明显的影响。对G...

2019-09-12 00:38:54 4200 1

原创 Python数据分析_Pandas入门_Chipotle快餐数据分析

背景科赛网“Pandas做数据分析”数据集,进行探索分析代码首先,导入数据集,查看数据背景科赛网“Pandas做数据分析”数据集,进行探索分析代码首先,导入数据集,查看数据查看不同item的购买数量不同item出现的次数统计对price进行处理增加“sub_total”列,查看每笔订单的总金额查看总收入是多少数据集中“choice_description”,猜...

2019-09-08 21:00:21 2742 1

原创 Boss 直聘数据岗招聘信息分析(二)

项目背景上一篇爬取Boss数据直聘数据后,我们可以试着对这些数据进行分析并整理一些结论出来。我们的大致步骤如下:清洗整理确定分析目的与思路进行数据分析得出数据分析结论分析思路数据岗位基本就业情况:学历要求、工作经验要求、工作技能要求、薪资待遇、公司福利学历要求:饼状图,学历要求的占比工作经验要求:饼状图工作技能要求:词云薪资待遇:条形图公司福利:词云,降序工作经...

2019-09-08 20:59:21 2090

原创 Boss 直聘数据岗招聘信息爬取(一)

爬取思路由于Boss直聘搜索职位不需要登陆,所以不涉及模拟登陆、cookies的问题,但是由于他会对同一时间访问过于频繁的ip进行验证,故而需要使用ip池。整理思路大致如下:1.使用ip池ip,boss首页搜索关键词,得到职位列表2.根据职位列表中的url,分别爬取每个职位的详细数据3.将爬取信息保存在mongo数据库内网页代码分析首先进入Boss直聘官网,搜索关键词“数据”,如图所...

2019-09-08 15:01:31 2444 4

原创 Python 练习册-0001 Random简单使用

题目:做为 Apple Store App 独立开发者,你要搞限时促销,为你的应用生成激活码(或者优惠券),使用 Python 如何生成 200 个激活码(或者优惠券)?解决方法:使用Random库,生成一定长度的字符串,保存在字典中并进行去重。    Random简介:是内建(built-in)函数,作用是产生随机数。    最常用的函数有:random.randint:生成int随机数;ran...

2018-05-02 00:15:46 306

原创 Python 练习册-0000 PIL库使用

题目:将你的 QQ 头像(或者微博头像)右上角加上红色的数字,类似于微信未读信息数量那种提示效果。解决方法:使用PIL库(Python Imaging Library,Python平台上很流行的图像处理标准库)中的ImageColor、ImageDraw、ImageFont模块。官方文档解释中:    The ImageColor module contains colour tables and...

2018-05-01 20:17:21 345

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除