用python爬虫爬取数据并存到数据库
1----------------------------------------------------------------------编写爬虫,下载数据
2----------------------------------------------------------------------处理数据
3----------------------------------------------------------------------python连接数据库并存储数据
1.编写爬虫,下载数据
首先需要的导入requests库(import requests)如果没有的话需要安装
在命令行界面输入pip install requests就是自动安装requests库了。
若安装成功,则显示如下:
安装好后接下来就可以编写爬虫了 爬虫的代码很简单
import requests
url=‘http://hq.sinajs.cn/list=sz000001,sh000001’
a=requests.get(url)
print(a.text)
这三行就可以把需要的数据下载下来了,效果如下
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190915183910427.png
2.处理数据
我们利用爬虫下载下来的其实是一个很长的字符串那,可以执行以下代码观察以下
str=a.text #将字符串以“;”分割转化为字符数组
a_array=str.split(";")
print(a_array)
然而 图片上显示的数组长度只有2,我们需要做的是将这个数组里的a_array[1]继续分割ÿ