python高级文件和爬虫

最新推荐文章于 2023-09-25 14:30:00 发布

Angelayouran

最新推荐文章于 2023-09-25 14:30:00 发布

阅读量442

点赞数

文章标签： python

本文链接：https://blog.csdn.net/angelayouran/article/details/80488828

版权

本文深入探讨了Python在高级文件操作方面的应用，包括文件遍历、读写模式、压缩与解压，以及如何利用Python强大的库进行高效网络爬虫开发，涉及HTTP请求、网页解析、数据存储等方面，助你提升Python编程实战能力。

摘要由CSDN通过智能技术生成

文件后续
转换文字:分辨文件的编码格式
num = open(r'C:\Users\悠然\Desktop\练字\python.txt','r+',encoding='gbk')
text = num.read()
print(text)

如图：

循环读以行为单位
num = open(r'C:\Users\悠然\Desktop\练字\新建文本文档.txt','r+',encoding='gbk')
text = num.readline()
while len(text)!=0:
    print(text,end='')
    #再读取一行下一行
    text = num.readline()

如图：

复制并替换
foo = open(r'C:\Users\悠然\Desktop\练字\python.txt','r+',encoding='gbk')
num = open(r'C:\Users\悠然\Desktop\练字\python2.txt','w+',encoding='gbk')
lines = foo.readlines()
print(lines)
for li in lines:
num.write(li.replace('哈哈哈','XXX'))
num.close()
foo.close()
print("复制并替换完毕")

如图：

小小爬虫
from urllib import request
请求打开一个网页
response = request.urlopen('https://www.taobao.com')
在本地创建一个文本
xml = open('python_xml.html','w+',encoding='utf-8')
把服务器的相应处理
html = response.read()
xml.write(str(html.decode('utf-8')))
print('读取完毕')

如图：