爬取创造与魔法游戏的 食谱大全

该代码示例使用Python的requests库获取网页内容,利用lxml的etree模块解析HTML,寻找对齐方式为居中的<p>标签内的文本。提取的数据被写入到一个名为食谱大全.txt的文件中,实现了网页数据的简单抓取和本地存储。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import requests
import pymysql
from lxml import etree
import pandas as pd


# UA伪装
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.63'
}

# url连接
url = 'https://www.9game.cn/czymf/2174371.html'
response = requests.get(url, headers=headers)
# print(response)
pege = response.text
# print(pege)


# 解析数据
tree = etree.HTML(pege)
list = tree.xpath('//p[@align="center"]')
# print(list)
c = []
# for i in list:
#     title = i.xpath('.//text()')
#     c.append(title)
#     print(c)
#     df = pd.DataFrame(c)
#     df.to_excel('c.xlsx')

for i in list:
    title = i.xpath('.//text()')
    print(title)
with open('食谱大全.txt','w',encoding='utf8') as f:
    for l in title:
        f.write(l+"\n")






# 存储数据




# # 持久化保存数据
# with open('创造与魔法.html','w',encoding='utf8') as fp:
#     fp.write(pege)
# print("爬取数据结束")


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值