- 博客(2)
- 收藏
- 关注
原创 正则 Xpath语法
正则:正规表达式 用来处理字符串 单字符匹配 . 除换行之外的任意字符 \d 表示数字 \D 匹配非数字 \w 匹配单词字符[a-z,A-Z,0-9] \W 匹配非单词字符 \s 匹配空白字符,空格,\n ,\t \S 匹配非空白字符 ^ 匹配以什么开头 & 匹配以什么结尾 [0-9] 等价于\d 匹配0-9 多字符匹配(贪婪模式) 匹配*前面的字符任意次数(0-无限) 匹配+前面的字符至...
2019-09-10 08:18:14 916
原创 爬虫urllib运行步骤
爬虫代码基本步骤: 第一步: 分析网站,寻找目标URL 第二步: 分析目标URL参数(get,post) get和post请求的区别: get请求参数部分:把?后面的参数写在字典中,然后使用parse.urlencode(字典参数),得到了url编码格式的字符串 post请求参数部分:是处理表单数据,将变淡u数据放在字典中,然后使用parse.urlencode(字典参数),得到了url编码格式的...
2019-09-09 08:59:45 131
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人