python
文章平均质量分 52
mrsama
这个作者很懒,什么都没留下…
展开
-
爬虫学习笔记(一)——Requests
import requestsrequests库主要有七个方法1、request() 是其余六种方法的基础,其余六种其实是返回以名字为参数的request函数2、get(url, params=None, **kwargs)3、head(url, **kwargs)4、post(url, data=None, json=None, **kwargs)5、put(ur原创 2017-08-23 00:13:46 · 338 阅读 · 0 评论 -
爬虫学习笔记(二)——BeautifulSoup
pip install beautifulsoup4from bs4 import BeautifulSoup基本元素:tag 标签Name tag.name 标签名Attributes tag.attrs 标签属性,字典类型NavigableString 标签内非属性字符串 tag.stringComment 标签内字符串的注释部分原创 2017-08-29 22:39:14 · 304 阅读 · 0 评论 -
爬虫学习笔记(三)——Re正则表达式
匹配规则:. 任何单个字符[] 单个字符的取值范围[^ ] 不取括号内的字符* 前一个字符的0至任意次+ 前一个字符的1次至任意次? 前一字符的0或1次| 左右表达式任意一个,相当于或运算{m} 前一个字符M次 ab{2}c=abbc{m,n} 前一字符m至n次^ 字符串开头$ 字符串结尾() 分组标记,内部只能用|,原创 2017-08-31 00:05:31 · 399 阅读 · 0 评论 -
Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法
使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗?不是的。 很多时候,我转载 2017-09-10 16:23:21 · 4863 阅读 · 0 评论