- 博客(4)
- 收藏
- 关注
原创 从西刺网获取可用的代理IP
欢迎转载,转载请注明原创哦 直接上完整代码啦,后面有保存为scrapy使用的格式和requests使用的格式,全部是保存为txt文本 import requests import chardet import random from scrapy.selector import Selector from telnetlib import Telnet url = 'http://www.xic...
2018-10-24 14:26:32
1586
转载 不通过第三个变量来交换两个数
转载自: https://blog.csdn.net/IT_arookie/article/details/83178610 方法一: int a = 1; int b = 2; a = b+(b=a)-a; 方法二: int a = 10; int b = 12; a=b-a; b=b-a; a=b+a; 或: int a=10; int b=12; a=a+b; b=a-b; a=a-b...
2018-10-21 11:51:06
125
1
转载 判断字符串中是否有文字
转载自:https://blog.csdn.net/IT_arookie/article/details/83187686 str = 'asfg哈哈哈' for i in str: if u'\u4e00' <= i <= u'\u9fff': print('存在中文') #存在中文 break ...
2018-10-21 11:31:09
347
原创 Python使用selenium爬取动态网页时遇到的问题
我们在做京东手机信息的爬取时,遇到的一些问题,现在就来跟大家分享一下。 1.首先,京东的网页是动态的,当我们搜索一个商品时,需要把页面往下翻,下面的内容才会出来,这也是我们选selenium方法的原因 解决方法:让浏览器模拟下拉几次页面即可 from selenium import webdriver import time import random url = 'https://www.jd....
2018-10-21 11:16:01
1524
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人