python_Txt存储
1、txt文件存储方法
- 功能:提取热门话题的问题、回答者、答案全文并存于txt文件
- open()方法打开文本文件,获取文件操作对象
file = open('explore.txt','a',encoding='utf8')
file.write('\n'.join(["question", "author", "answer"]))
file.write('\n' + '=' * 50 + '\n')
file.close()
- with as语法,在with控制块结束时,文件会自动关闭,不用再调用close()方法;
with open('explore.txt', 'a', encoding='utf8') as file:
file.write('\n'.join(["question", "author", "answer"]))
file.write('\n' + '=' * 50 + '\n')
- 推荐使用with open() as file保存文件方法
import requests
from pyquery import PyQuery as pq
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3710.0 Safari/537.36'}
html = requests.get('https://www.zhihu.com/explore',headers=headers).text
doc = pq(html)
items = doc('.explore-feed.feed-item').items()
for item in items:
question = item.find('h2').text()
author = item.find('.author-link').text()
answer = pq(item.find('.content').html()).text()
with open('explore.txt', 'a', encoding='utf8') as file:
file.write('\n'.join([question, author, answer]))
file.write('\n' + '=' * 50 + '\n')
2、文件打开方式
方式 | 解释 |
---|
r | 以只读方式打开文件。 |
rb | 以二进制只读方式打开文件。 |
r+ | 以读写方式打开文件。 |
rb+ | 以二进制读写方式打开文件。 |
w | 以写入方式打开一个文件。如果文件已存在,则将其覆盖,如果文件不存在,则创建新文件。 |
wb | 以二进制写入方式打开一个文件。如果文件已存在,则将其覆盖,如果文件不存在,则创建新文件。 |
w+ | 以读写方式打开一个文件。如果文件已存在,则将其覆盖,如果文件不存在,则创建新文件。 |
wb+ | 以二进制读写方式打开一个文件。如果文件已存在,则将其覆盖,如果文件不存在,则创建新文件。 |
a | 以追加方式打开一个文件。如果文件已存在,新的内容会被写入到已有内容之后,如果文件不存在,则创建新文件写入。 |
ab | 以二进制追加方式打开一个文件。如果文件已存在,新的内容会被写入到已有内容之后,如果文件不存在,则创建新文件写入。 |
a+ | 以读写方式打开一个文件。如果文件已存在,新的内容会被写入到已有内容之后,如果文件不存在,则创建新文件写入。 |
ab+ | 以二进制读写方式打开一个文件。如果文件已存在,新的内容会被写入到已有内容之后,如果文件不存在,则创建新文件写入。 |