python爬虫
文章平均质量分 77
K-D小昊
这个作者很懒,什么都没留下…
展开
-
pyhton基础爬虫代码片段
pyhton爬虫代码片段基础BeautifulSoup爬取网页代码片段包含库文件读取整个网页代码读取网页第一个某标签读取网页所有某标签读取网页所有某标签中的某元素按照css的class类找到网页内容嵌套查找正则匹配导入正则模块正则匹配Requests 爬取网页代码片段导入库文件get模式 获取整个网页post模式 获取整个网页cookiesession下载文件urlretrieve下载requests下载requests分批下载协程运行爬虫demodemo基础BeautifulSoup爬取网页代码片段包原创 2020-10-29 15:46:51 · 172 阅读 · 0 评论 -
python 正则表达式代码片段
python 正则表达式代码片段import库文件在string里寻找某单词匹配单次多个字符字符匹配模式匹配对每一行单独匹配重复匹配分组找到所有的匹配项找到某个字符串并替换他以某种匹配模式分割字符串保存某种匹配规则import库文件import re在string里寻找某单词pattern1 = "cat"pattern2 = "bird"string = "dog runs to cat"print(re.search(pattern1, string)) # <_sre.SRE_原创 2020-10-29 11:01:32 · 124 阅读 · 0 评论 -
python爬虫爬取圆通快递信息
python爬虫爬取圆通快递信息代码运行效果代码import json,requests #引入必要的库文件i = 999 #一共爬取多少行companyName = "yuantong" #圆通的姓名number = 9113734027455 #快递单号packageNum = "YT"+str(number) #组合单号和前缀def e_d(number): #定义从快递100获取信息的函数 url2 = 'http://www.kuaidi100.com/query?type=原创 2020-07-02 12:38:45 · 1288 阅读 · 3 评论