python
我要七龙ru
诗是家,远方是媳妇。
展开
-
Python-用__slots__限制类属性
代码class student: __slots__ = ("name","age") #使用slots语句,限制类只可以有name,age这两个属性s = student();s.name = "jeek"print(s.name)s.age = 13print(s.age)s.score = 100 #这里给类动态加载了新的属性,程序会报<AttributeError>错误p原创 2017-08-17 19:07:27 · 356 阅读 · 0 评论 -
常用的User-Agent
userAgent = [ "Mozilla/5.0 (Linux; U; Android 2.3.7; en-us; Nexus One Build/FRF91) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1", "MQQBrowser/26 Mozilla原创 2017-10-10 17:25:30 · 1369 阅读 · 0 评论 -
使用Python爬取中国大学排名,并格式化对其输出内容
首先,我们需要注意几点 1.可以使用isinstance语句配合bs4库中的bs4.element.Tag判断获取到的对象是不是标签对象. 2.输出内容并且要求他用空白补齐时,系统默认用的是英文空白符,英文空白符和中文空白符(chr(12288)获取)宽度不一样。import requestsfrom bs4 import BeautifulSoupimport bs4 #导入bs4库是为了原创 2017-09-22 14:58:19 · 1852 阅读 · 0 评论 -
visual studio2017 python3安装beautifulsoup4
第一步 先去beautifulsoup官网下载beautifulsoup的文件: https://www.crummy.com/software/BeautifulSoup/bs4/download/第二步 把下载文件解压到python的根目录 第三步 打开power shell(cmd高级版) 1.系统自带的有,但我没有用这个安装过。 2.使用visual studio 2017 p原创 2017-09-12 00:21:28 · 6086 阅读 · 1 评论 -
python获取服务器响应cookie
总结先贴一个代码事情经过更好的解决方案总结调试网站获取cookies时请查看,r.header和r.request.header这两个属性,因为cookie说不准出现在他们俩谁里面。先贴一个代码import reimport requestsfrom bs4 import BeautifulSoupdef printHeaders(headers): for h in head原创 2017-09-26 11:51:58 · 9108 阅读 · 0 评论 -
python yield(生成器)的简单使用
生成器有什么用? 简单来说,他能有效的帮我们提高程序运算速度和节约内存空间。 生成器是怎么工作的? 每一次调用生成器,生成器都会从上一次出现yeild的地方继续运行代码。如果是第一次运行生成器,那么生成器就会从函数的一开始开始运行(从接收参数的地方开始)。def gen(num): for i in range(num): yield i ** 2#每次调用这个生成器原创 2017-09-24 09:21:53 · 411 阅读 · 0 评论 -
python-序列解包(对可迭代元素的快速取值)
一般情况下x,y,z = 1,2,3print("x:",x)print("y:",y)print("z:",z)#运行结果x: 1y: 2z: 3 对元祖序列解包name = ("qiaobushi","wanglihong","leibushi")x,y,z = nameprint(name)print("x:",x)print("y:",y)print("z:",原创 2017-08-27 11:41:41 · 2360 阅读 · 0 评论 -
python爬虫-Requests库
Requests库官方中文参考手册 点我跳转Requests库安装 只要在控制台上输入 Windows系统:pip install requests Linux系统:sudo pip install requests 我用的是VS,所以用的这个控制台 如果你也出现了拒绝访问这种情况,你只需要把拒绝访问的这个文件夹获取管理员权限,然后再尝试安装几次(因为我获取后再安原创 2017-08-20 22:41:11 · 482 阅读 · 0 评论 -
python爬虫-下载图片到本地目录
import requestsimport osurl = "https://ss0.bdstatic.com/5aV1bjqh_Q23odCf/static/superman/img/logo/bd_logo1_31bdc765.png"root = "F://python//"path = root + url.split("/")[-1]try: if not os.path原创 2017-08-22 22:14:11 · 15147 阅读 · 0 评论 -
python爬虫-网站是如何防止爬虫的
第一种方法:通过检测请求头的user-agent字段来检测你是一个爬虫还是一个浏览器(人类),这时如果想让爬虫正常访问该网站,可以把自己的请求头user-agent字段修改为浏览器的(通过抓包可以获取)。第二张方法:在根目录下放置Robots.txt文件,告知爬虫自觉遵守。 例如CSDN的Robot.txt文件内容如下(访问www.csdn.com/robots.txt获取) 这个文件写明了在根原创 2017-08-22 20:17:13 · 3060 阅读 · 0 评论 -
python-类的属性
python-类的属性原创 2017-08-15 12:45:36 · 288 阅读 · 0 评论 -
装饰器的简单使用
#定义封装函数def log(func): def wrap(*args,**kw): #func.__name__表面打印程序名称 print("begin:%s()" % func.__name__) #在程序运行前打印开始 ret = func(*args,**kw) print("end:%s()" % func.__name__)原创 2017-08-15 10:40:59 · 263 阅读 · 0 评论 -
使用turtle库画蛇
代码import turtledef drawSnake(rad,angle,len,nackrad): for i in range(len): turtle.circle(rad,angle) #画圆,参数分别是半径和角度 turtle.circle(-rad,angle) #半径为负,反方向画圆 turtle.circle(rad,angle/原创 2017-08-20 20:02:29 · 2008 阅读 · 0 评论 -
python-集合操作
colletion1 = set([1,2,3,4]) #必须是set,才能进行集合运算colletion2 = set([3,4,5])one = colletion1 & colletion2 #求交集print("one:%s" % one)two = colletion1 - colletion2 #求差集(conlletion2的补集)print("two:%s" % two)原创 2017-08-18 00:10:15 · 216 阅读 · 0 评论 -
Python-三种括号的区别
python中的小括号( )代表tuple元组数据类型,元组是一种不可变序列。python中的中括号[ ]代表list列表数据类型,列表是一种可变的序列。python大括号{ }花括号代表dict字典数据类型,字典是由键对值组组成。原创 2017-08-17 23:47:06 · 844 阅读 · 0 评论 -
python-用@property将一个方法(例如getXxx/setXxx)变成属性
代码class student: @property def score(self): return self._score#注意!! 一定要是self._score 注意“下划线”,这是一个私有的属性。 @score.setter #如果不设置这个属性,那么将无法给这个属性赋值 def score(self,value): if not原创 2017-08-17 19:59:15 · 956 阅读 · 0 评论 -
python之正则表达式
前述: 阿,又是正则表达式,这已经是第三次学正则表达式,但是也是学的最好的一次,这次看到北京理工大学嵩天老师的视频,讲的很好。以下是视频ppt的一些截图和同时。 提示: 1.正则表达式除了可以用了字符串(string)来表示还可以用正则表达式自己的字符串表示(raw string) 2.如何使用(raw string)只要在字符串前面加一个r,例如r”^[A-Za-z0-9]+$”。 3.原创 2017-09-22 17:30:29 · 457 阅读 · 0 评论