- 博客(5)
- 收藏
- 关注
原创 Python 爬虫笔记(3)
1、引入模块from bs4 import BeautifulSoupimport reimport urllibimport sqlite3import xlwt2、定义得到一个指定的URL网页内容的函数#得到一个指定URL的网页内容def askURL(url): head={ #模拟浏览器,向像豆瓣服务器发送消息(伪装) "User-Agent":"Mozilla/5.0(WindowsNT10.0;WOW64)AppleWe
2021-10-24 13:09:29 139
原创 python 爬虫笔记(2)
准本工作https://movie.douban.com/top250(https表示加密网址)分析页面网址第一页第二页前面路径没变多了?加一些参数Url分析:页面包括250条电影数据,每页25条共10页每页的url不同之处是:最后的数值=(页数-1)*25我们需要的数据都在网页的源代码中,假如我们需要找到每一个电影标题,那么我们怎样定位呢?借助Chrome开发者工具(F12)来分析网页...
2021-10-24 13:09:04 106
原创 python 爬虫笔记(1)
任务:爬取豆瓣电影Top250的基本信息,包括电影的名称、豆瓣评分、评价数、电影概况、电影链接等。https://movie.douban.com/top250爬虫基本知识是什么?爬虫就是按照一定的规则,自动抓取互联网信息的程序或者脚本。做什么?可以通过浏览器访问的数据(视频,照片等)都可以通过爬虫获取。爬虫的本质?模拟浏览器打开网页,获取网页中我们想要的那部分数据(数据解析)。将浏览器展示出来的信息选择部分我们感兴趣、对我们有价值的东西保存起来。基本流程:准备.
2021-10-24 13:08:37 2254
原创 python for/else语句理解
构造包含十以内的质数数组第一次外循环i=2,未执行内循环(未执行break),直接执行外循环else语句在空列表b中追加元素i;第二次外循环i=3,内循环n=3时,执行break,不执行else语句。(当n=i-1时没有执行break语句则需要跳出内循环,执行else语句;n<i-1时,执行了break,则不需要执行else语句)如当i=4时,n=2,满足if条件执行break,结束内循环,不执行else语句,即未将4追加进列表b总结:如果for循环中执行...
2021-10-17 15:15:43 331
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人