python高级文件和爬虫

本文深入探讨了Python在高级文件操作方面的应用,包括文件遍历、读写模式、压缩与解压,以及如何利用Python强大的库进行高效网络爬虫开发,涉及HTTP请求、网页解析、数据存储等方面,助你提升Python编程实战能力。
摘要由CSDN通过智能技术生成
文件后续
转换文字:分辨文件的编码格式
num = open(r'C:\Users\悠然\Desktop\练字\python.txt','r+',encoding='gbk')
text = num.read()
print(text)
如图:

循环读 以行为单位
num = open(r'C:\Users\悠然\Desktop\练字\新建文本文档.txt','r+',encoding='gbk')
text = num.readline()
while len(text)!=0:
    print(text,end='')
    #再读取一行  下一行
    text = num.readline()
如图:

复制 并替换
foo = open(r'C:\Users\悠然\Desktop\练字\python.txt','r+',encoding='gbk')
num = open(r'C:\Users\悠然\Desktop\练字\python2.txt','w+',encoding='gbk')
lines = foo.readlines()
print(lines)
for li in lines:
    num.write(li.replace('哈哈哈','XXX'))
num.close()
foo.close()
print("复制 并替换完毕")
如图:

小小爬虫
from urllib import request
 请求打开一个网页
response = request.urlopen('https://www.taobao.com')
在本地 创建一个文本
xml = open('python_xml.html','w+',encoding='utf-8')
把服务器的相应 处理
html = response.read()
xml.write(str(html.decode('utf-8')))
print('读取完毕')
如图:

图二:
完毕!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值