股票数据定向爬虫

最新推荐文章于 2020-05-22 22:31:35 发布

Kyrie_tim

最新推荐文章于 2020-05-22 22:31:35 发布

阅读量5.5k

点赞数 2

本文链接：https://blog.csdn.net/Kyrie_tim/article/details/93145512

版权

功能描述：获取上交所和深交所所有股票名称和交易信息

输出：保存到文本文件中

技术路线：requests - bs4 - re

数据网站的确定：

获取股票列表 - 东方财富网：http://quote.eastmoney.com/stock_list.html

获取个股信息 - 百度股票：https://gupiao.baidu.com/stock/ (例：https://gupiao.baidu.com/stock/sz000100.html

import requests
from bs4 import BeautifulSoup
import re
 
def getHTMLText(url, code="utf-8"):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = code
        return r.text
    except:
        return ""
 
def getStockList(lst, stockURL):
    html = getHTMLText(stockURL)
    soup = BeautifulSoup(html, 'html.parser') 
    a = soup.find_all('a')
    for i in a:
        try:
            href =

最低0.47元/天解锁文章

Kyrie_tim

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
股票数据定向爬虫

功能描述：获取上交所和深交所所有股票名称和交易信息输出：保存到文本文件中技术路线：requests - bs4 - re数据网站的确定：获取股票列表 - 东方财富网：http://quote.eastmoney.com/stock_list.html 获取个股信息 - 百度股票：https://gupiao.baidu.com/stock/ (例：http...
复制链接

扫一扫