python-东方财富网贴吧评论数据爬取

最新推荐文章于 2024-08-09 08:38:02 发布

little_sesame_

最新推荐文章于 2024-08-09 08:38:02 发布

阅读量3.1k

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/little_sesame_/article/details/106891649

版权

本文分享了一段用于爬取东方财富网贴吧文本数据的Python代码，适用于学术研究或数据分析。欢迎大家在评论区交流讨论，提出问题和改进建议。

摘要由CSDN通过智能技术生成

python-东方财富网贴吧文本数据爬取

分享一下写论文时爬数据用到的代码，有什么问题或者改善的建议的话小伙伴们一起评论区讨论。

def getzssz399001DATA(x,y):  #爬取x至y页的帖子
    import requests
    from bs4 import BeautifulSoup
    output = open('zssz399001_f_{}_{}.xls'.format(x,y),'w',encoding='utf-8')
    output.write('read\tcomment\thref\tposter\ttitle\ttime\ttime2\tpost\n') 
    for i in range(y,x,-1):
        url = "http://guba.eastmoney.com/list,zssz399001,f_{}.html".format(i)
        r1 = requests.get(url)
        r1.raise_for_status()
        soup = BeautifulSoup(r1.content,"html.parser")
        l1a1 = soup.find_all('span',class_ = "l1 a1")
        l2a2 = soup.find_all('span',class_

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

little_sesame_

关注关注

1
点赞
踩
22

收藏

觉得还不错? 一键收藏
5
评论
python-东方财富网贴吧评论数据爬取

python-东方财富网贴吧文本数据爬取分享一下写论文时爬数据用到的代码，有什么问题或者改善的建议的话小伙伴们一起评论区讨论。def getzssz399001DATA(a,b): #爬取a至b页的帖子 import requests from bs4 import BeautifulSoup output = open('zssz399001_f_{}_{}.xls'.format(a,b),'w',encoding='utf-8') output.write('re
复制链接

扫一扫