自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据分析(一)豆瓣华语电影分析

本文首发于『运筹OR帷幄』公众号,大家也可前往公众号查看,《用数据带你了解电影行业—华语篇》。在之前,我们已经用通过爬虫获取了豆瓣华语电影共33133部电影的数据,具体爬虫介绍请见之前的博文,爬虫实战(一)——利用scrapy爬取豆瓣华语电影。本文对爬虫过程进行简要概述后,对这部分数据进行分析。1. 前言随着生活的水平提高,人们开始了对精神生活的追求,电影已经成为我们生活中必不可少的一项娱乐...

2018-11-27 22:40:29 9235 4

原创 安装mitmproxy过程中pyasn1报错

在pip安装mitmproxy时,出现一个pyasn1卸载的错误:Cannot uninstall 'pyasn1'. It is a distutils installed project and thus we cannot accurately determine which files belong to it which would lead to only a partial uni...

2018-10-30 14:18:46 1850 2

原创 爬虫实战(一)利用scrapy爬取豆瓣华语电影

在学习爬虫之前,翻过知乎上的一个回答:利用爬虫技术能做到哪些很酷很有趣很有用的事情?,这大概是我学习爬虫最初的动力。而现在踏过小白阶段后,便开始也想做这样的事情,结合数据分析或是其他的,做一些有趣的东西。那从简单的开始,第一个爬虫项目是爬取豆瓣华语电影的数据,后面将利用这部分数据进行分析。1. 爬取思路在观察了豆瓣每个影片的链接地址后,写下了主要思路:在豆瓣电影的选片页面,筛选所有华语(...

2018-10-07 22:18:37 5739 4

2018年豆瓣最新华语电影数据

通过爬虫获取的豆瓣最新华语电影数据,字段包括电影名称、上映年份、制片地区、语言、导演、类型、主演、上映日期、片长、评分、参会评分人数等。具体数据类型可参见我的博文:https://blog.csdn.net/weixin_43004311/article/details/82962159。数据截止日期为2018年9月。

2018-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除