【Python采集股票吧帖子、评论数据-使用stock_stil库】

Python数据分析


前言

        今天介绍了Python采集股票吧帖子、评论数据的功能,通过使用stock_stil库,我们可以很轻松的采集到相关数据。


一、stock_stil是什么?

        stock_stil是由科技创新实验室成员(本人)开发的一款用于股票数据分析库,目前仅支持股票吧数据的采集任务,后续会不断完善和更新相关功能。

二、背景知识

        股票吧(股吧_东方财富网旗下股票社区_东方财富网股吧 (eastmoney.com)是东方财富旗下的股票论坛,东方财富是中国专业的互联网财富管理综合运营商,为海量用户提供基于互联网的财经资讯、数据、交易等服务。

        通过采集股票论坛的用户帖子、评论等信息,可以进行帖子的主题、用户情感分析,从而进一步挖掘股票用户情感、主题趋向与股票价格变动的影响因素。

三、使用步骤

1.引入库

pip install stock-stil -i https://pypi.org/simple

2.获取对应吧的帖子内容

        这里我们以上证指数吧为例子,其中zssh000001是上证指数吧的代码。通过使用stock_stil的comments模块,使用其中的getEastMoneyPostList()函数,通过传递一个stock_code,从而获取对应吧的帖子内容。

#引入stock_stil的comments模块
from stock_stil import comments

#使用comments模块的方法获取对应吧的帖子内容
post_list=comments.getEastMoneyPostList(stock_code="zssh000001")
for post in post_list:
    #打印帖子标题
    print(post.post_id)
    #打印帖子发布者的昵称
    print(post.user_nickname)
    #打印帖子的点击数量
    print(post.post_click_count)
    

        运行上述代码,返回对应吧的帖子列表,通过循环进行打印帖子标题。上述只是一个简单的演示,在post对象里面还有非常多的属性,所有的变量命名都是以下划线的形式,大家可以使用Pycharm编辑器的自动补全功能轻松显示各种属性值,最终结果如下所示:

        通过对象的__dict__属性获取对象的字典形式。

3.获取对应帖子的正文内容

        每一个帖子,除了标题外,进入帖子内部还会有帖子的正文内容,我们也可以使用stock_stil库轻松获得,通过示使用getEstMoneyPostDetail()函数,传递stock_code(吧的代码)、post_id帖子id从而获取对应吧下面的对应的帖子的相关信息。

#引入stock_stil的comments模块
from stock_stil import comments

#使用comments模块的方法获取对应吧的帖子内容
post_detail=comments.getEstMoneyPostDetail(stock_code="zssh000001",post_id="1462421588")
#获取帖子最后评论时间
print(post_detail.post_last_time)
#获取帖子作者的作者信息
print(post_detail.post_user)
#打印正文内容
print(post_detail.post_content)

        上述代码是一个简单的例子,post_detail拥有很多的属性,可以获取帖子的状态、归属地、作者等级等信息,大家可以自行研究。下面是代码运行的结果,其中正文是html格式,可以进一步进行解析。

3.获取对应帖子的评论内容

        有些帖子可能会有评论数据,我们可以通过comments模块的getEasyMoneyPostReplyList()方法,通过传递一个post_id从而获取对应帖子下的评论,其中page是页数参数,用于控制获取评论的位置。

#引入stock_stil的comments模块
from stock_stil import comments

#使用comments模块的方法获取对应吧的帖子内容,page是评论页数
comments_list=comments.getEasyMoneyPostReplyList(post_id="1461937740",page=1)
for comment in comments_list:
    #打印评论用户信息
    print(comment.reply_user.__dict__)
    #打印评论内容
    print(comment.reply_text)
    #打印评论点赞数量
    print(comment.reply_like_count)
    print("-"*20)

        上述是一个简单的示例,大家可以自行获取其他属性。运行结果如下所示:

总结

        以上就是今天要讲的内容,本文仅仅简单介绍了stock_stil库的使用,后续stock_stil库也会不断更新和完善。通过使用stock_stil库,可以方便的获取股票用户信息、帖子以及对应的股票相关的评论。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

极客小云

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值