- 博客(4)
- 收藏
- 关注
原创 爬取豆瓣电影名称及评论绪论
本章根据豆瓣所有的电影,分析各国各地区各类别时间年份评分数量等各个参数之间的联系,大体上进行分析。1.研究意义主要比较世界电影和中国,以及中国大陆和中国港台电影之间的差别,分析各参数之间是否存在关联性及对评分产生的影响2.研究的主要内容主要爬取豆瓣电影的名字及评分进行可视化分析3.国内外现状从数据看出,豆瓣世界电影,近些年的好评的趋势在逐年下降,特别是近两年!也就是说,在豆瓣里,近些年的低分评价越来越多,从评分均值上看,一直处于下滑状态,而且下滑曲线越来越陡,大量的低质量电影充斥着电影世界,导致平均分被严重
2022-06-09 09:49:57 907
原创 爬取豆瓣电影中各种类型电影名称与评分
一、明确需求爬取豆瓣排行电影信息二、发送请求请求url地址,使用get请求,添加headers请求头,模拟浏览器请求三、获取数据requests.get(url=url, headers=headers) 请求网页返回的是response对象response.text: 获取网页文本数据response.json: 获取网页json数据四、解析数据常用解析数据方法: 正则表达式、css选择器、xpath、lxml…五、保存数据(数据持久化)常用的保存数据方法 with open像豆瓣电影信息这样的数据
2022-06-07 16:58:04 527
原创 NumPy
1.认识NumPy数组属性 具体说明 ndarray.ndim 维度个数,也就是数组轴的个数,比如一维、二维、三维等 ndarray.shape 数组的维度。整数元组,表示每个维度数组的大小。例:一个n行和m列的数组,它的shape属性为(n,m) ndarray.size 数组元素的总个数,等于shape属性中元组元素的乘积 ndarray.dtype 数组中元素类型的对象,可用Python类型与NumP特有的数据类型指定 nd...
2022-03-06 00:18:53 324
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人