实训
从不掉发
这个作者很懒,什么都没留下…
展开
-
Jupyter noteook爬取猫眼top部电影(正则表达式)
正则表达式正则表达式是对字符串操作的一种逻辑公式,通过一些特定的字符或特定字符的组合对字符串进行定位、筛选。在爬取网页信息时通常会找出在元素中的逻辑,再应用正则表达式进行过滤。例如,我们要获取主演信息(徐峥,周一围,王传君),定位到 主演:徐峥,周一围,王传君 ,构造正则表达式,c = re.findall(’.?主演:(.?)\n’,result,re.S),re.findall函数查找符合要求的所有元素;使用re.S,正则表达式会将字符串作为一个整体,在整体中进行匹配,否则,只在一行内进行匹配,原创 2021-12-24 10:24:10 · 1128 阅读 · 0 评论 -
Jupyter notebook爬取猫眼top100电影信息(Xpath)
@[TOC]Jupyter notebook 爬取猫眼top100部电影Jupyter notebook 简介基于网页交互式运算的应用程序,可以在网页上编写和执行代码。本文将使用Xpath方法获取信息。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;增加了 图片原创 2021-12-23 14:33:00 · 3734 阅读 · 0 评论