声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关
网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台!
本案例所需要的模块:
1.requests 2.re(内置) 3.pandas 4.pyecharts
其他均需要 pip install 模块名
爬取步骤:
一.请求数据 模拟浏览器向服务器发送请求
F12 打开开发者模式 点击网络 搜索我们需要的数据 找到正确的接口
老样子 使用工具能够使我们节约时间 方便快捷但前提能够自己写就没问题
新建本地py文件复制过去 运行之后就可以看到与浏览器预览中一样的数据
接着我们需要对请求到的数据进行处理
这里我们使用正则是最好的
匹配所需的内容 即()里的
text = re.findall(r'datas:[(.*?)]',response.text)
二.提取数据 提取所需要的内容
然后我们观察放回的数据 把每条数据都提取出来
此时我们想该使用什么