Python
donglynn
这个作者很懒,什么都没留下…
展开
-
Python截取指定中文字符之后的内容的最简单办法。
timestamp = '发布人员:李丽丽 发布时间: 2008-09-15 :00:00:00' timestamp = response.doc('.exam-view-title').remove('a').text() timestamp = timestamp[timestamp.index('发布时间:') + len('发布时间:'.decod...原创 2020-04-12 11:14:37 · 1136 阅读 · 1 评论 -
python将dict中的unicode打印成中文
import jsona = {u'content': {u'address_detail': {u'province': u'\u5409\u6797\u7701', u'city': u'\u957f\u6625\u5e02', u'street_number': u'', u'district': u'', u'street': u'', u'city_code': 53}, u'poi...转载 2018-05-22 17:55:44 · 4156 阅读 · 3 评论 -
Jquery Pyquery 如何选择多class、有空格的class、两个class的元素
如果你想选择带空格的多个class的元素,比如<element class="a b">使用:$('.a.b')如果这个元素还有一个id,<element class="a b" id = 'c'>,使用:$('#a.b.c')...原创 2018-03-01 10:43:25 · 5643 阅读 · 3 评论 -
AttributeError: ‘module’ object has no attribute’xxx 问题解决
报错:AttributeError: ‘module’ object has no attribute’xxx 原来是,你创建的py脚本名字不能与python预留字,模块名等相同。比如包叫abcsat,import abcsat 之后,不要把创建的文件名写作abcsat.py。同时还要删除已经生成的pyc文件。原创 2017-12-13 19:51:52 · 10782 阅读 · 1 评论 -
python 使用urllib2发送get请求和post请求
1.发送get请求第一种方法,注意,有些地方误传这种方法发送的post请求,实际这是发送的get请求,urllib.urlencode明显是get请求的编码url = 'http;//www.baidu.com'postdata = dict('username' : 'admin', 'password':'notapass')postdata=urllib.urlencode(postdat原创 2017-09-02 16:38:23 · 4819 阅读 · 1 评论 -
Python爬虫实战五之模拟登录淘宝并获取所有订单
Python爬虫实战五之模拟登录淘宝并获取所有订单经过多次尝试,模拟登录淘宝终于成功了,实在是不容易,淘宝的登录加密和验证太复杂了,煞费苦心,在此写出来和大家一起分享,希望大家支持。温馨提示更新时间,2016-02-01,现在淘宝换成了滑块验证了,比较难解决这个问题,以下的代码没法用了,仅作学习参考研究之用吧。本篇内容1. python模拟登录淘宝网页2转载 2017-09-04 14:58:15 · 3543 阅读 · 1 评论 -
Python爬虫利器六之PyQuery的用法
原文地址:http://cuiqingcai.com/2636.html前言你是否觉得 XPath 的用法多少有点晦涩难记呢?你是否觉得 BeautifulSoup 的语法多少有些悭吝难懂呢?你是否甚至还在苦苦研究正则表达式却因为少些了一个点而抓狂呢?你是否已经有了一些前端基础了解选择器却与另外一些奇怪的选择器语法混淆了呢?嗯,那么,前端大大们的福音转载 2017-05-17 10:23:54 · 449 阅读 · 0 评论 -
Python 标准库 urllib2 的使用细节
问题描述: 没有设置timeout参数,结果在网络环境不好的情况下,时常出现read()方法没有任何反应的问题,程序卡死在read()方法里,搞了大半天,才找到问题,给urlopen加上timeout就ok了,设置了timeout之后超时之后read超时的时候会抛出socket.timeout异常,想要程序稳定,还需要给urlopen加上异常处理,再加上出现异常重试,程序就完美了。转载 2017-05-06 20:32:00 · 313 阅读 · 0 评论 -
Python 列表(list)、字典(dict)、字符串(string)常用基本操作小结
[python] view plain copy创建列表 sample_list = ['a',1,('a','b')] Python 列表操作 sample_list = ['a','b',0,1,3] 得到列表中的某一个值 value_start = sample_list[0] end_value = sam转载 2017-05-04 16:28:26 · 275 阅读 · 0 评论 -
Pyquery的html tag不闭合的问题
1. 问题描述from pyquery import PyQuery as pqhtml="<h3></h3>"a=pq(html)print(a.html())//会输出 <h3/>2.解决办法from pyquery import PyQuery as pqhtml="<h3></h3>"a=pq(html)print(a.html(method='html'))//会输出原创 2017-05-23 15:42:45 · 772 阅读 · 0 评论 -
Python多线程抓取代理服务器
Python作为一门功能强大的脚本语言来说,经常被用来写爬虫程序,下面是Python爬虫多线程抓取代理服务器。年前是用 http://blog.linuxeye.com/340.html 来抓取代理服务器的,谁知道过完年回来http://www.cnproxy.com/被墙,导致某网站不能抓取东西,停止更新。现在改抓取 http://www.proxy.com.ru 的代理服务器,转载 2015-05-08 13:29:56 · 3010 阅读 · 0 评论