![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
金艾一
大概是个半死宅半虫合丝的准程序员吧
展开
-
Python正则表达式和re库
----------------------正则表达式--------------操作符.任何单个的字符[]字符集,对单个的字符给出取值范围[^]非字符集,对单个的字符给出排除范围*前个字符的0到无限次出现+前个字符的1到无限次出现?前个字符0到1次出现|或,取其一{m}扩展它的前一个字符m次{m,n}扩展他的前一个字符m到n次^将当前模式从字符串开头开始匹配$将当前模式...原创 2019-12-28 16:42:48 · 156 阅读 · 0 评论 -
Python网页爬虫练习:requests库&Beautiful爬取bilibili网页信息
我是卢本伟!import requestsfrom bs4 import BeautifulSoupimport bs4def get_blibli_vedio():#获取bilibili实时热榜视频排行榜 url = "https://www.bilibili.com/ranking?spm_id_from=333.851.b_7072696d6172795061676554...原创 2019-12-27 18:48:15 · 972 阅读 · 0 评论 -
Python网络爬虫 BeautifulSoup库的使用方法
Beautifulsoup库的基本组成元素和基本的API调用方法,需要注意的地方都在注释里了#!/usr/bin/env python # -*- coding:utf-8 -*-import requestsfrom bs4 import BeautifulSoupdef test_beautifulsoup():#测试BeautifulSoup try: ...原创 2019-12-26 13:39:16 · 240 阅读 · 0 评论 -
Python request库基本使用方法
request库的基本使用方法,不多bb,上代码,需要注意的地方都在注释里了import requestsfrom bs4 import BeautifulSoupdef get_html_text(url): try: r=requests.get(url,timeout=50)#返回的r是Response类的对象,超过50s时抛出Timeout异常 ...原创 2019-12-26 13:36:12 · 477 阅读 · 0 评论