文件(file)
- 打开文件的方式
打开文件程序会调用内置的open函数,格式为:open(“文件名,打开方式”)。处理模式:“r”:为输入打开文件;“w”:为输出生成并打开文件;“a”:在文件尾部追加内容并打开文件 - 文件的写入
要是写入文件,确保之前的打开模式有“w”或者“a”,否则会报错,而且要使用w模式会将之前的文件全部删除,使用a模式是在原来的内容上追加 - 文件对象的操作方法
打开文件并取得文件对象后,就可以利用文件对象的一些方法对文件进行读取或修改等操作:
例如 f.close()关闭文件;f.read([size=1])读取size个字符;f.write(str)将字符串str写入文件等 - 对Excel与CSV文件进行操作
# CSV的读取
import CSV#导入模块
#打开CSV文件
with open("文件地址","r")as c
svfile:#r代表read
#读取文件
read=CSV.reader(csvfile)
#print(read)
for i in read:#使用遍历的方式来读取文件
print(i)
#CSV的写入
with open(“文件地址”,‘w’)as CSVfile:#这里w代表write写入
writer=csv.writer(CSVfile)
writer.writerow(['id','url','keywords'])
data=[
('1','http://www.xiaoheiseo.com/','小黑’),
('2','http://www.baidu.com/','百度’)
]
writer.writerows(data)#多行写入时为writerows
#读取Excel
import xlrd#引入模块
#打开文件,获取Excel文件的workbook对象
workbook=xlrd.open_workbook("wenjian.xls")#文件路径
#写入Excel
import xlwt
#创建一个workbook对象,相当于创建一个 Excel文件
book=xlwt.workbook(encoding="utf-8",style_compression=0)
os模块
python一般是通过os模块来实现,模块是一个包含所有定义的函数与变量的文件
import os
os.getcwd()
'D:\\wenjian'
os.listdir('d:\\wenjian2')
['各种文件‘]
datatime模块
datetime定义了两个变量:
- datetime.MINYEAR-date和datetime对象所支持的最小年份
- datetime.MAXYEAR-date和datetime对象所支持的最大年份
datetime模块中定义的类: - datetime.date -表示日期的类,常用属性:year,month,day
- datetime.time-表示时间的类,常用属性:hour,minute,second等
- datetime.datetime-表示时间和日期的类
- datetime.timedella-表示时间间隔
- datetime.tzinfo-表示时区的基类
类和对象
对象=属性(变量)+方法(函数)
面向对象(object oriented)的特征:
- 封装
- 继承
- 多态
- 组合
正则表达式
- re.match()
match()视图是从字符串的起始位置对模块进行匹配,若匹配成功,就会返回一个匹配对象,若失败,则返回None
re.match(pattern,string[,flags=0])
-
re.search()
re.match() 总是从字符串开始的位置匹配所以多数情况能匹配的概率不大,而re.search()是在字符串中搜索正则表达式模式,任何位置都可以 -
re模块
- 拆分字符串:re.split(pattern,string)
- 替换字符串1:re.sub(pattern,repl,string)
- 替换字符串2:re.subn(pattern,repl,string)
- 找到所有的匹配1:re.findall(pattern,string)
- 找到所有的匹配2:re.finditer(pattern,string)
http请求
http请求步骤:
- 域名解析
- 发起tcp的3次握手
- 建立tcp连接后的发起http请求
- 服务器端响应http请求,浏览器得到HTML代码
- 浏览器解析HTML代码,并请求HTML代码的资源
- 浏览器对页面进行渲染并呈现给用户