自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Python 爬虫笔记(4)

前面的

2021-10-24 13:57:29 112

原创 Python 爬虫笔记(3)

1、引入模块from bs4 import BeautifulSoupimport reimport urllibimport sqlite3import xlwt2、定义得到一个指定的URL网页内容的函数#得到一个指定URL的网页内容def askURL(url): head={ #模拟浏览器,向像豆瓣服务器发送消息(伪装) "User-Agent":"Mozilla/5.0(WindowsNT10.0;WOW64)AppleWe

2021-10-24 13:09:29 108

原创 python 爬虫笔记(2)

准本工作https://movie.douban.com/top250(https表示加密网址)分析页面网址第一页第二页前面路径没变多了?加一些参数Url分析:页面包括250条电影数据,每页25条共10页每页的url不同之处是:最后的数值=(页数-1)*25我们需要的数据都在网页的源代码中,假如我们需要找到每一个电影标题,那么我们怎样定位呢?借助Chrome开发者工具(F12)来分析网页...

2021-10-24 13:09:04 75

原创 python 爬虫笔记(1)

任务:爬取豆瓣电影Top250的基本信息,包括电影的名称、豆瓣评分、评价数、电影概况、电影链接等。https://movie.douban.com/top250爬虫基本知识是什么?爬虫就是按照一定的规则,自动抓取互联网信息的程序或者脚本。做什么?可以通过浏览器访问的数据(视频,照片等)都可以通过爬虫获取。爬虫的本质?模拟浏览器打开网页,获取网页中我们想要的那部分数据(数据解析)。将浏览器展示出来的信息选择部分我们感兴趣、对我们有价值的东西保存起来。基本流程:准备.

2021-10-24 13:08:37 2222

原创 python for/else语句理解

构造包含十以内的质数数组第一次外循环i=2,未执行内循环(未执行break),直接执行外循环else语句在空列表b中追加元素i;第二次外循环i=3,内循环n=3时,执行break,不执行else语句。(当n=i-1时没有执行break语句则需要跳出内循环,执行else语句;n<i-1时,执行了break,则不需要执行else语句)如当i=4时,n=2,满足if条件执行break,结束内循环,不执行else语句,即未将4追加进列表b总结:如果for循环中执行...

2021-10-17 15:15:43 318

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除