关闭

Requests库

解析json 保存二进制数据 上传文件 获取cookie 证书验证 代理设置: 认证设置:...
阅读(58) 评论(0)

Urllib

urllib.request Handler Cookie:维持状态 获取cookie: 保存cookie: 利用保存的cookie打开网页: urllib.error(异常) urllib.parse(解析)...
阅读(45) 评论(0)

用python读取pdf文档

首先要安装库:pdfminer3kfrom pdfminer.converter import PDFPageAggregator from pdfminer.layout import LAParams from pdfminer.pdfparser import PDFParser, PDFDocument from pdfminer.pdfinterp import PDFResourceMa...
阅读(36) 评论(0)

用python操作mysql

安装python库: 1、pip install pymysql 2、通过安装文件python setup.py install将从维基百科爬取的词条存入mysql:#引入开发包 from urllib.request import urlopen from bs4 import BeautifulSoup import re import pymysql.cursors #请求URL并把结果用...
阅读(38) 评论(0)

mysql

mysql的一些常见问题: https://zm12.sm-tc.cn/?src=l4uLj8XQ0J2TkJjRnIybkdGRmovQnI2ehYbOzczK0J6Ni5ack5rQm5qLnpaTjNDNz8rNy8fMzg%3D%3D&uid=f1147d0ab9c0637b1acd2cdc0327e1c6&restype=1&from=derive&depth=3&link_type=6...
阅读(51) 评论(0)

利用urllib和BeautifulSoup爬取维基百科的词条

#引入开发包 from urllib.request import urlopen from bs4 import BeautifulSoup import re #请求URL并把结果用UTF-8编码 resp=urlopen("https://zh.wikipedia.org/wiki/Wikipedia:%E9%A6%96%E9%A1%B5").read().decode("utf-8") #使...
阅读(63) 评论(0)

BeautifulSoup的基本用法

from bs4 import BeautifulSoup import re#一段代码 html_doc = """ The Dormouse's story The Dormouse's story Once upon a t...
阅读(44) 评论(0)

urllib

urllib是python3.x中提供的一系列操作URL的库,它可以轻松的模拟用户使用浏览器访问网页。 使用步骤: 1、导入urllib库中的request模块:from urllib import request2、请求URLresp=request.urlopen('http://www.baidu.com')3、使用响应对象输出数据print(resp.read().decode("utf...
阅读(37) 评论(0)

列表解析式和生成器表达式

列表解析式:[expr for iter_var in iterable][expr for iter_var in iterable if cond_expr]例如:[i*10 for i in range(10)]结果: [0,10,20,30,40,50,60,70,80,90][i*10 for i in range(10) if i<5]结果: [0,10,20,30,40]生成器(g...
阅读(38) 评论(0)

模块和包

模块:模块是python组织代码的基本方式。python的脚本都是用扩展名为py的文本文件保存的,一个脚本可以单独运行,也可以导入另一个脚本中运行。当脚本被导入时,我们将其称为模块(module)。例如:我们编写了一个名为pachong.py的脚本,则可以在另外一个脚本中用import pachong语句来导入它。在进行导入操作时,被作为模块的py文件,要是不希望导入它的py文件执行它的主函数,用下...
阅读(27) 评论(0)

分支结构(switch)

switch语句用于编写多分支结构的程序,类似与if….elif….else语句。 switch语句表达的分支结构比if…elif…else语句表达的更清晰,代码的可读性更高 但是python并没有提供switch语句。python可以通过字典实现switch语句的功能,实现方法分为两步: 首先,定义一个字典 其次,调用字典的get()获取相应的表达式。计算器:from __future__...
阅读(33) 评论(0)

匿名函数lambda

lambda函数是一种快速定义单行的最小函数。 使用python写一些执行脚本时,使用lambda可以省去定义函数的过程,让代码更加精简。>>> def f(x,y): return x*y >>> f(1,2) 2>>> g=lambda x,y:x*y >>> g(2,3) 6 >>> g=lambda x:x**2 >>>g(3) 9...
阅读(35) 评论(0)

Python对内存的使用(深拷贝和浅拷贝)

浅拷贝就是对引用的拷贝(只拷贝父对象) 深拷贝就是对对象的资源的拷贝>>> a=[1,2,3,'a','b'] >>> b=a >>> b [1, 2, 3, 'a', 'b'] >>> a [1, 2, 3, 'a', 'b'] >>> id(a) 3021737547592 >>> id(b) 3021737547592 >>> a.append('c') >>> a [1, 2, 3, 'a...
阅读(30) 评论(0)

爬虫实例:爬取一个网页上的图片地址

读取一个网页的源代码:import urllib.request def getHtml(url): html=urllib.request.urlopen(url).read() return html print(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7...
阅读(26) 评论(0)

正则表达式(4)之内置属性

1、点(.)可以匹配任何一个字符,但是不能匹配换行符等字符。用内置属性: S 可以使点(.)匹配包括换行在内的所有字符>>> import re >>> r=r'owolf.com' >>> re.findall(r,'owolf.com') ['owolf.com'] >>> re.findall(r,'owolfxcom') ['owolfxcom'] >>> re.finda...
阅读(26) 评论(0)

正则表达式(3)之常用函数

1、编译正则表达式(re.compile()):将正则表达式编译成对象,来进行匹配,会比解释性执行快很多。如果正则表达式需要经常进行匹配,建议编译成对象。>>>import re >>>r1=r'\d{3,4}-?\d{8}' >>>p_tel=re.compile(r1) >>>p_tel re.compile('\\d{3,4}-?\\d{8}') >>> p_tel.findall('010-...
阅读(37) 评论(0)

正则表达式(2)之元字符的用法

反斜杠的作用: 要想将一个元字符^当一个普通字符处理,加反斜杠 例如:>>>import re >>>r=r'\^abc' >>>re.findall(r,'^abc ^abc ^abc') ['^abc','^abc','^abc']\d匹配任何十进制数,它相当于类[0-9]. \D匹配任何非数字字符,它相当于类[^0-9] \s匹配任何空白字符,他相当于类[\t\n\r\f\v] \S...
阅读(96) 评论(0)

正则表达式(1)

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式引擎。正则表达式(RE)是一种小型的、高度专业化的编程语言,在(python中)它内嵌在python中,并通过re模块实现。 可以为想要匹配的相应字符串集指定规则。该字符串集可能包含英文语句、e-mail地址、命令或任何你...
阅读(27) 评论(0)

python的冗余参数

1.python函数的形参和实参必须一 一对应 2.定义一个函数和元组,将元组中的值传递给参数,如:t=('a','b') def fun(x,y): print x,y要使元组中的两个元素分别与函数的x,y对应,执行下面的语句fun(*t)#用单星号运行结果:a b 而运行fun(t)语句,会出现错误。因为t只表示一个参数。 3.参数的初始化>>> def fun(name="xia...
阅读(48) 评论(0)

python中的全局变量和局部变量

python中的任何变量都有其特定的作用域在函数中定义的变量一般只能在函数内部使用,这是局部变量。在一个文件顶部定义的变量可以供该该文件中的任何函数调用,这些可以为整个程序所使用的变量称为全局变量global语句 global 变量名 强制声明为全局变量。 在函数内部的变量声明为全局变量时,只有先执行函数以后,函数内部的全局变量才生效...
阅读(27) 评论(0)
48条 共3页1 2 3 下一页 尾页
    个人资料
    • 访问:3594次
    • 积分:388
    • 等级:
    • 排名:千里之外
    • 原创:26篇
    • 转载:15篇
    • 译文:0篇
    • 评论:2条
    文章存档
    最新评论