Forrest_Gump_sad-CSDN博客

转载 python爬虫框架Scrapy的安装

本文为转载内容（原文地址：https://blog.csdn.net/qq_41646358/article/details/81335359）安装Scrapy 安装方法有两种: 如果你电脑上有Anaconda的话,可以使用这种方法 windows+r >>> cmd >>> conda install scrapy >>> 回车 2....

2019-04-18 13:58:51 140

原创 python爬虫学习第二天，利用BeautifulSoup库和Requests库爬取网站

一开始我是打算拿div里的标签做文章，使用它们的class来寻找内容，但是这样寻找出来的内容存在重复的可能，所以我就直接寻找到了它们的整个table（因为整个html里只有一个table），让在整个table里寻找我们需要的td标签，利用循环找到我们需要的内容（我这里一开始使用的是t.string，但是当td里没有内容是返回的是None，所以我就改用了t.text这样返回的就是一个空字符串）。这...

2019-04-17 16:44:56 539

原创记录正则表达式的操作符介绍

正则表达式操作符 .表示任何字符 []字符集，对单个字符给出取值范围 [^ ]非字符集，对单个字符给出排除范围例：[^abc]表示出现一个字符，但字符不是a或b或c 前一个字符0次或无限次扩展例：abc表示ab,abc,abcc,abccc等 +前一个字符1次或无限次扩展例：abc+表示abc,abcc,abccc等？前一个字符0次或1次扩展例：abc?表示ab,abc |左右...

2019-04-16 15:02:26 150

原创 Python爬虫学习第一天

###调用requests库，获取网页源代码 import requests url = “http://www.baidu.com” r = requests.get(url) r.raise_for_status() #产生异常信息 r.encoding = r.apparent.encoding #修改编码 print(r.text) ###爬取京东中的一个页面 import reque...

2019-04-16 14:57:04 177

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 python爬虫框架Scrapy的安装

原创 python爬虫学习第二天，利用BeautifulSoup库和Requests库爬取网站

原创 记录正则表达式的操作符介绍

原创 Python爬虫学习第一天

空空如也

空空如也

原创记录正则表达式的操作符介绍