Python爬虫
加加油小马仔
重头来过,学习WEB攻防
展开
-
Python爬虫—BeautifulSoup
环境安装: pip install bs4BeautifulSoup对象实例化方式:soup = BeautifulSoup(fp,'lxml') #本地文件创建方式,fp代表本地文件名称soup = BeautifulSoup(page_text,'lxml') #网页源码创建方式,page_text代表网络请求得到的页码源码数据BeautifulSoup对象解析数据的三种方法:案例文本:<html lang="en"><head> <met原创 2022-02-07 17:55:51 · 684 阅读 · 0 评论 -
Python爬虫-正则表达式
1.元字符: . 匹配除换行符以外的所有字符; \w 匹配字符、下划线、数字; \d 匹配数字 \s 匹配空白字符 \n 匹配换行符 \t 匹配通配符(tab键) \W 匹配非字符、下划线、数字; \D 匹配非数字 \S 匹配非空白符 ^ 匹配字符串的开始 $ 匹配字符串的结尾 a|b 匹配a或者b原创 2022-01-24 10:05:39 · 825 阅读 · 0 评论