今天又没学到什么之爬取星座运势

最新推荐文章于 2022-10-25 13:08:44 发布

闪灵INGShin

最新推荐文章于 2022-10-25 13:08:44 发布

阅读量270

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/weixin_43728206/article/details/104800008

版权

Python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

思路：
1.确认要的东西：
在这里插入图片描述

也就是网站上的这个表格。对应到源代码里的位置（如下图）：
在这里插入图片描述

2.利用requests库向星座网站发送请求
3.利用lxml库提取想要的数据

代码：


import requests
from lxml import etree

def sspider(htext):
html = etree.HTML(htext)
html_data = html.xpath('//div[@class ="content clearfix"]/table[@class = "tb"]/tr/td/text()')

for num in range(0,len(html_data),2):
print(html_data[num]+" : "+html_data[num+1])

if __name__ == '__main__':
result = requests.get('http://astro.sina.com.cn/fate_tomorrow_Scorpio/')
result.encoding = 'utf-8';#解决中文乱码
sspider(result.text)

效果图：
在这里插入图片描述

总结：
这次爬虫爬取的是网站表格，加深了对lxml库的熟悉程度。
慢慢进步呀少年！

其实本想用itchat将爬到的星座运势，每天早上定时发给小姐姐的
程序也写好了。
But

太怂了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

闪灵INGShin

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
今天又没学到什么之爬取星座运势

思路：1.确认要的东西：也就是网站上的这个表格。对应到源代码里的位置（如下图）：2.利用requests库向星座网站发送请求3.利用lxml库提取想要的数据代码：import requestsfrom lxml import etreedef sspider(htext):html = etree.HTML(htext)html_data = html.xpath('/...
复制链接

扫一扫