自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 【kaggle项目】Airbnb(爱彼迎)使用用户情况分析

数据来源: kaggle比赛项目【Airbnb New User Bookings】https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data主要分析内容:1. 用户的画像分析- 用户性别分布特征- 用户年龄段的分布特征- 用户地区的分布特征2. 用户使用渠道的分析- 用户使用设备类型分析-以下为在jupy...

2019-10-09 01:57:40 4357

原创 对某电商交易数据的分析(数据经后期加工处理,不造成任何隐私泄露问题)

数据来源:某电商真实交易数据,经过后期处理,不会造成任何隐私的泄露。分析分为两步进行:数据清洗:主要是基于numpy和pandas库来进行重复值的处理和空值的处理,以及一些异常值的清洗。数据分析:该部分以不同的维度来进行分析,包括以产品、城市为维度并以销量和GMV指标进行分析;以价格为维度,并使用cut来进行分桶处理;通过对不同渠道下的订单量和GMV进行排序和分析;以及下单的时间分布情况...

2019-10-08 17:14:27 610 2

原创 爬取拉勾网“全国”“数据分析”、“深圳市”“数据分析”岗位招聘信息并进行分析

数据爬取:先编写了Python程序对“拉勾网”进行“数据分析”岗的招聘信息并存储为csv格式。其中使用到Request Headers伪装成浏览器来访问网页,由于网站的反爬措施,仅使用请求头的信息仍然会弹出错误提示,因此需要使用*Request.Seeion()*生成cookies小饼干来维持会话。连接成功之后则是使用到json来解析网页信息,并通过循环的方式爬取出我们需要的信息。详细的代码见下...

2019-10-07 02:01:12 373

爬取拉勾网“全国”“数据分析”、“深圳市”“数据分析”岗位招聘信息并进行分析.ipynb

使用Python简单爬取了拉勾网“全国”“数据分析”、“深圳市”“数据分析”岗位招聘基本信息,并进行了简单分析

2019-10-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除