自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 爬取豆瓣电影名称及评论绪论

本章根据豆瓣所有的电影,分析各国各地区各类别时间年份评分数量等各个参数之间的联系,大体上进行分析。1.研究意义主要比较世界电影和中国,以及中国大陆和中国港台电影之间的差别,分析各参数之间是否存在关联性及对评分产生的影响2.研究的主要内容主要爬取豆瓣电影的名字及评分进行可视化分析3.国内外现状从数据看出,豆瓣世界电影,近些年的好评的趋势在逐年下降,特别是近两年!也就是说,在豆瓣里,近些年的低分评价越来越多,从评分均值上看,一直处于下滑状态,而且下滑曲线越来越陡,大量的低质量电影充斥着电影世界,导致平均分被严重

2022-06-09 09:49:57 907

原创 爬取豆瓣电影中各种类型电影名称与评分

一、明确需求爬取豆瓣排行电影信息二、发送请求请求url地址,使用get请求,添加headers请求头,模拟浏览器请求三、获取数据requests.get(url=url, headers=headers) 请求网页返回的是response对象response.text: 获取网页文本数据response.json: 获取网页json数据四、解析数据常用解析数据方法: 正则表达式、css选择器、xpath、lxml…五、保存数据(数据持久化)常用的保存数据方法 with open像豆瓣电影信息这样的数据

2022-06-07 16:58:04 527

原创 数据聚合与分组运算

数据聚合与分组运算

2022-05-17 00:35:24 417

原创 NumPy

1.认识NumPy数组属性 具体说明 ndarray.ndim 维度个数,也就是数组轴的个数,比如一维、二维、三维等 ndarray.shape 数组的维度。整数元组,表示每个维度数组的大小。例:一个n行和m列的数组,它的shape属性为(n,m) ndarray.size 数组元素的总个数,等于shape属性中元组元素的乘积 ndarray.dtype 数组中元素类型的对象,可用Python类型与NumP特有的数据类型指定 nd...

2022-03-06 00:18:53 324

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除