- 博客(4)
- 收藏
- 关注
原创 从西刺网获取可用的代理IP
欢迎转载,转载请注明原创哦直接上完整代码啦,后面有保存为scrapy使用的格式和requests使用的格式,全部是保存为txt文本import requestsimport chardetimport randomfrom scrapy.selector import Selectorfrom telnetlib import Telneturl = 'http://www.xic...
2018-10-24 14:26:32 1625
转载 不通过第三个变量来交换两个数
转载自: https://blog.csdn.net/IT_arookie/article/details/83178610方法一:int a = 1;int b = 2;a = b+(b=a)-a;方法二:int a = 10;int b = 12;a=b-a;b=b-a; a=b+a;或:int a=10;int b=12;a=a+b;b=a-b;a=a-b...
2018-10-21 11:51:06 148 1
转载 判断字符串中是否有文字
转载自:https://blog.csdn.net/IT_arookie/article/details/83187686str = 'asfg哈哈哈'for i in str: if u'\u4e00' <= i <= u'\u9fff': print('存在中文') #存在中文 break...
2018-10-21 11:31:09 363
原创 Python使用selenium爬取动态网页时遇到的问题
我们在做京东手机信息的爬取时,遇到的一些问题,现在就来跟大家分享一下。1.首先,京东的网页是动态的,当我们搜索一个商品时,需要把页面往下翻,下面的内容才会出来,这也是我们选selenium方法的原因解决方法:让浏览器模拟下拉几次页面即可from selenium import webdriverimport timeimport randomurl = 'https://www.jd....
2018-10-21 11:16:01 1635 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人