python爬虫-爬取股票贴吧帖子

为了研究股民情绪与股票走势的关系,本文档介绍了如何使用Python进行爬虫,具体聚焦于爬取东方财富吧内的股友会帖子信息,以获取大量讨论数据。
摘要由CSDN通过智能技术生成

因为课题需要爬取大量的股吧的股民讨论情况,以此继续探讨股民情绪对股票走势的影响
而我负责爬虫和分词工作,亲手写了一个爬虫代码,来爬取股吧-东方财富吧的股友会帖子信息
代码如下:

#!/usr/bin/env python
# -*-coding:utf-8 -*-
import urllib
import urllib2
import re
#导入对excel文件进行操作的库
import xlwt
#创建表格,设置编码模式,创建新的sheet
book=xlwt.Workbook(encoding='utf-8',style_compression=0)
sheet=book.add_sheet('dede',cell_overwrite_ok=True)

#j的作用是对url不断进行修改,翻页
for j in range(1,1192):
    print j
    url = 
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值