数据分析
第一步:采集数据(数据来源:爬虫(网络数据采集)、调差问卷收集、从专门的公司购买数据公司建立的数据库)。
第二步:数据预处理(工具:python、Excel、人工等)
第三步:借助算法、模型等进行体系建设。
文件操作
数据持久化:将数据从瞬时状态转换为持久状态。
open(参数1,参数2,参数3…):打开文件。
- 参数1:路径和文件名。
- 参数2:文件打开的方式(读和写)。
- 参数3:文件打开的编码形式:utf-8.
语法:.表示当前文件件(可省): …表示返回上一级。
文件夹和文件夹之间以及文件夹和文件之间需要使用\间隔。
路径:相对路径、绝对路径
- 相对路径:以当前所找参照物为基础,另一个文件相对于参照物的所在位置,应该使用/。通常使用相对路径。
- 绝对路径:以磁盘为参照物,使用\。
在文件夹B中返回寻找文件A: …\文件夹A\文件A
参数1:
open(r'./test/文件1.txt') # 通常使用相对路径
open(r'E:\qianfeng\pythonProject1\day07\test\文件1.txt')
参数2:r(只读)、a(只写)、w(只写)、+等
- r:文件不存在,报错。
- w:文件不存在,先自动创建;文件存在,先清空;如果某个文件夹不存在,不创建文件夹。
- a:文件不存在,报错;文件存在,在文件内容后写上新的内容。
- +:可读可写,将r,w,a变成可读可写的符号:r+、w+、a+;python操作文件不能同时读写。
- r,w,a,+:文本编辑方式
- t,b:文件展示形式
- t:文本
- b:字节
- r,w,a等价于rt,wt,at,tr,tw,ta:t默认,可省。
- rb,wb,ab,br,bw,ba表示以字节形式操作文件。
f1 = open('./test/管理员.jpg','rb')
result = f1.read()
print(result,type(result))
# <class 'bytes'>
# b'.....' 字节
参数3:encoding=‘utf-8’
f = open(r'./test/文件1.txt','r',encoding='utf-8')
print(f)
# <_io.TextIOWrapper name='./test/文件1.txt' mode='r' encoding='utf-8'>
f.write() #报错
read():从文件中读取信息.
所有文件在内存中是以二进制形式保存的。
f = open(r'./test/文件1.txt','r',encoding='utf-8')
result = f.read()
print(result,type(result))
# 咏鹅
# [唐] 骆宾王
# 鹅,鹅,鹅,曲项向天歌。
# 白毛浮绿水,红掌拨清波。 <class 'str'>
文件写操作
python操作文件流程
- 新建文件
- 写入内容
- 保存关闭
- 写操作
f = open('./test/咏鹅.txt','w',encoding='utf-8')
str1 = '\t 咏 鹅\n\t[唐] 骆宾王\n鹅,鹅,鹅,曲项向天歌。\n白毛浮绿水,红掌拨清波。'
print(str1)
# 咏 鹅
# [唐] 骆宾王
# 鹅,鹅,鹅,曲项向天歌。
# 白毛浮绿水,红掌拨清波。
多个write不换行,在后面的write内容前加\n
f.write(str1)
f.write('\n咏 鹅')
f.close()
# f.write('1')
# ValueError: I/O operation on closed file. 文件关闭后不能再进行写操作。
# 咏 鹅
# [唐] 骆宾王
#鹅,鹅,鹅,曲项向天歌。
#白毛浮绿水,红掌拨清波。
#咏 鹅
文件读操作
指针:文件操作时指针默认在文件开始位置。指针会随着文件操作不断变化。
- read():一次性读完所有内容,读出结果为字符串。
f = open('./test/咏鹅.txt','r',encoding='utf-8')
print(f.read())
f.close()
# 咏 鹅
# [唐] 骆宾王
# 鹅,鹅,鹅,曲项向天歌。
# 白毛浮绿水,红掌拨清波。
- readline():一次读取一行内容,读出结果为字符串。
f = open('./test/咏鹅.txt','r',encoding='utf-8')
print(f.readline())
f.close()
# 咏 鹅
- readlines():一次读全部内容,每一行内容作为列表中的一个元素。
f = open('./test/咏鹅.txt','r',encoding='utf-8')
print(f.readlines())
f.close()
# ['\t 咏 鹅\n', '\t[唐] 骆宾王\n', '鹅,鹅,鹅,曲项向天歌。\n', '白毛浮绿水,红掌拨清波。\n']
图片的读写操作
- 读取图片
f1 = open('./test/管理员.jpg','rb')
result = f1.read()
f1.close()
- 下载图片
f2 = open('./test/photo1.jpg','wb')
f2.write(result)
f2.close()
f1与f2只有文件名不同,其余全部相同。