**
爬虫(一):用Python获取东方财富股吧评论
**
第一次尝试爬虫,因为需要选择了东方财富股吧,需要的小伙伴可以一起来学习,首先声明一下,本人也是从b站学来了,第一次就是照葫芦画瓢,有样学样获取的。首先附一下视频连接吧,有需要的可以去看详细内容哦~时间也不是很长
https://www.bilibili.com/video/BV1oz4y1Z7pt?from=search&seid=12230486286090734478
库
需要用到的库有:etree,requests,pandas
requests:获取网页的
etree中的lxml:解析网页文档的
pandas:保存文档
所以呢,需要用到的小伙伴需要先将前两个库下载下来~
接下来就是敲代码了
代码上该有的注释都有了,这里我就不赘述了,想知道获取的详情可以看视频,他讲得很详细呢~
'''第一步:导入相关库'''
from lxml import etree #解析文档
import requests #获取网页
import pandas as pd #保存文件
'''
需要保存的内容:
从股吧网页页面来看,有阅读量、评论量、标题、作者和时间
'''
max_page = int(input("请输入最大获取页面:")) #最大爬取页面
all_reards