python
用户昵称不能为空
想马儿跑又想马儿不吃草。情商很低怎么了
展开
-
python 提取网页 charset 的方法
经过十几万网页采集测试,有效率99%def pick_charset(html): """ 从文本中提取 meta charset :param html: :return: """ charset = None m = re.compile('<meta .*(http-equiv="?Content-Type"?.*)?charset="?原创 2017-03-02 23:30:11 · 3770 阅读 · 1 评论 -
Python彻底解决采集网页乱码问题
实战十几万网页采集后的修正版:python彻底解决网页采集乱码问题def download_page(indexurl, timeout=10): """ 下载网站数据并返回 :param indexurl: :param timeout: :return: """ try: res = urllib2.urlopen(inde原创 2017-03-02 23:25:43 · 1862 阅读 · 0 评论