学习python的第七天

本文详细介绍了文件操作的基本步骤,包括数据采集、预处理、模型建设,并重点讲解了Python中文件的打开、读写、追加等模式,以及文件编码与文件指针的概念。通过实例展示了如何进行文本和字节的读写操作,同时还涵盖了图片的读取与下载。这些基础知识对于数据分析和数据持久化至关重要。
摘要由CSDN通过智能技术生成

数据分析

第一步:采集数据(数据来源:爬虫(网络数据采集)、调差问卷收集、从专门的公司购买数据公司建立的数据库)。

第二步:数据预处理(工具:python、Excel、人工等)

第三步:借助算法、模型等进行体系建设。

文件操作

数据持久化:将数据从瞬时状态转换为持久状态。

open(参数1,参数2,参数3…):打开文件。

  1. 参数1:路径和文件名。
  2. 参数2:文件打开的方式(读和写)。
  3. 参数3:文件打开的编码形式:utf-8.

语法:.表示当前文件件(可省): …表示返回上一级。

文件夹和文件夹之间以及文件夹和文件之间需要使用\间隔。
路径:相对路径、绝对路径

  • 相对路径:以当前所找参照物为基础,另一个文件相对于参照物的所在位置,应该使用/。通常使用相对路径。
  • 绝对路径:以磁盘为参照物,使用\。
    在文件夹B中返回寻找文件A: …\文件夹A\文件A

参数1:

open(r'./test/文件1.txt')     # 通常使用相对路径
open(r'E:\qianfeng\pythonProject1\day07\test\文件1.txt')

参数2:r(只读)、a(只写)、w(只写)、+等

  • r:文件不存在,报错。
  • w:文件不存在,先自动创建;文件存在,先清空;如果某个文件夹不存在,不创建文件夹。
  • a:文件不存在,报错;文件存在,在文件内容后写上新的内容。
  • +:可读可写,将r,w,a变成可读可写的符号:r+、w+、a+;python操作文件不能同时读写。
  • r,w,a,+:文本编辑方式
  • t,b:文件展示形式
  • t:文本
  • b:字节
  • r,w,a等价于rt,wt,at,tr,tw,ta:t默认,可省。
  • rb,wb,ab,br,bw,ba表示以字节形式操作文件。
f1 = open('./test/管理员.jpg','rb')
result = f1.read()
print(result,type(result))
# <class 'bytes'>
# b'.....' 字节

参数3:encoding=‘utf-8’

f = open(r'./test/文件1.txt','r',encoding='utf-8')
print(f)
# <_io.TextIOWrapper name='./test/文件1.txt' mode='r' encoding='utf-8'>
f.write()    #报错

read():从文件中读取信息.

所有文件在内存中是以二进制形式保存的。

f = open(r'./test/文件1.txt','r',encoding='utf-8')
result = f.read()
print(result,type(result)) 
#        咏鹅
#     [唐] 骆宾王
#  鹅,鹅,鹅,曲项向天歌。
#  白毛浮绿水,红掌拨清波。 <class 'str'>

文件写操作

python操作文件流程

  1. 新建文件
  2. 写入内容
  3. 保存关闭
  4. 写操作
f = open('./test/咏鹅.txt','w',encoding='utf-8')
str1 = '\t  咏  鹅\n\t[唐] 骆宾王\n鹅,鹅,鹅,曲项向天歌。\n白毛浮绿水,红掌拨清波。'
print(str1)
# 	  咏  鹅
# 	[唐] 骆宾王
# 鹅,鹅,鹅,曲项向天歌。
# 白毛浮绿水,红掌拨清波。

多个write不换行,在后面的write内容前加\n

f.write(str1)
f.write('\n咏  鹅')
f.close()
# f.write('1')  
# ValueError: I/O operation on closed file. 文件关闭后不能再进行写操作。
# 	  咏  鹅
#	[唐] 骆宾王
#鹅,鹅,鹅,曲项向天歌。
#白毛浮绿水,红掌拨清波。
#咏  鹅

文件读操作

指针:文件操作时指针默认在文件开始位置。指针会随着文件操作不断变化。

  • read():一次性读完所有内容,读出结果为字符串。
f = open('./test/咏鹅.txt','r',encoding='utf-8')
print(f.read())
f.close()
# 	  咏  鹅
# 	[唐] 骆宾王
# 鹅,鹅,鹅,曲项向天歌。
# 白毛浮绿水,红掌拨清波。
  • readline():一次读取一行内容,读出结果为字符串。
f = open('./test/咏鹅.txt','r',encoding='utf-8')
print(f.readline())
f.close()
# 	  咏  鹅
  • readlines():一次读全部内容,每一行内容作为列表中的一个元素。
f = open('./test/咏鹅.txt','r',encoding='utf-8')
print(f.readlines())
f.close()
# ['\t  咏  鹅\n', '\t[唐] 骆宾王\n', '鹅,鹅,鹅,曲项向天歌。\n', '白毛浮绿水,红掌拨清波。\n']

图片的读写操作

  1. 读取图片
f1 = open('./test/管理员.jpg','rb')
result = f1.read()
f1.close()
  1. 下载图片
f2 = open('./test/photo1.jpg','wb')
f2.write(result)
f2.close()

f1与f2只有文件名不同,其余全部相同。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值