from bs4
import BeautifulSoup
from urllib.request import urlopen # 打开网页
html = urlopen('http://example.com').read()# 解析
HTML soup = BeautifulSoup(html,'html.parser')# 查找所有段落
paragraphs = soup.find_all('p')for p in paragraphs:print(p.get_text())
3.docx - 用于处理Microsoft Word文档(.docx)。
简介:docx是一个用于创建、读取和修改.docx文件的库。
示例代码:
from docx
import Document # 创建一个新的Word文档
doc = Document()# 添加标题
doc.add_heading('Hello World',1)# 添加段落
doc.add_paragraph('This is a sample paragraph.')# 保存文档
doc.save('example.docx')