网址为:http://quote.eastmoney.com/center/gridlist.html#hs_a_board
先来看看效果
这是网站上的内容
下面是用Jupyter Notebook运行效果,pycharm运行也是一样只是没Jupyter Notebook美观
下面是保存在CSV表格中的效果
以下为代码
import requests,re,pandas
from fake_useragent import UserAgent
num=input('请输入你要爬取股票信息的页数,目前共有224页每页为20个股票数据\n')
UA={
'User-Agent':UserAgent().random}
r1='"f14":"(.*?)",' #股票名称
r2='"f12":"(.*?)",' #股票代码
r3='"f2":(.*?),"' #股票最新价
r4='"f3":(.*?),"' #股票涨跌幅
r5='"f4":(.*?),"' #股票涨跌额
r6='"f5":(.*?),"' #股票成交量手
r7='"f6":(.*?),"' #股票成交额
r8='"f7":(.*?),"' #股票振幅
r9='"f15":(.*?),"' #股票最高
r10='"f16":(.*?),"'#股票最低
r11='"f17":(.*?),"'#股票今开
r12='"f18":(.*?),"'#股票昨收
r13='"f23":(.*?),"'#市净率
r14='"f8":(.*?),"'#换手率
r15='"f9":(.*?),"'#市盈率(动态)
r16='