"""
已周大生为例;
2018/4/10-2018/6/20
抓取业绩说明会前后的股民评论
"""
#!/usr/bin/env python
# -*-coding:utf-8 -*-
import urllib
import urllib2
import re
#导入对excel文件进行操作的库
import xlwt
#创建表格,设置编码模式,创建新的sheet
book=xlwt.Workbook(encoding='utf-8',style_compression=0)
sheet=book.add_sheet('dede',cell_overwrite_ok=True)
#j的作用是对url不断进行修改,翻页
length1 = 1192
for j in range(1,20): #
print j
url = 'http://guba.eastmoney.com/list,002867,5,f_'+str(j)+'.html'
try:
request=urllib2.Request(url)
response=urllib2.urlopen(request)
content = response.read().decode('utf-8')
pattern = re.compile('<span class.*?title=(.*?)>',re.S)
title = re.findall(pattern, content)
pattern = re.compile('<span class.*?<a href.*?data-popper.*?>(.*?)</
金融情感分析,股市预测(二)
最新推荐文章于 2023-02-15 09:44:50 发布
本文通过东方财富网股吧抓取周大生业绩说明会前后文本,进行情感分析,探讨情感数据如何影响股市预测,提供 xls 文件格式的数据示例。
摘要由CSDN通过智能技术生成