自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Jupyter noteook爬取猫眼top部电影(正则表达式)

正则表达式正则表达式是对字符串操作的一种逻辑公式,通过一些特定的字符或特定字符的组合对字符串进行定位、筛选。在爬取网页信息时通常会找出在元素中的逻辑,再应用正则表达式进行过滤。例如,我们要获取主演信息(徐峥,周一围,王传君),定位到 主演:徐峥,周一围,王传君 ,构造正则表达式,c = re.findall(’.?主演:(.?)\n’,result,re.S),re.findall函数查找符合要求的所有元素;使用re.S,正则表达式会将字符串作为一个整体,在整体中进行匹配,否则,只在一行内进行匹配,

2021-12-24 10:24:10 1121

原创 Jupyter notebook爬取猫眼top100电影信息(Xpath)

@[TOC]Jupyter notebook 爬取猫眼top100部电影Jupyter notebook 简介基于网页交互式运算的应用程序,可以在网页上编写和执行代码。本文将使用Xpath方法获取信息。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;增加了 图片

2021-12-23 14:33:00 3726

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除