python爬股票历史价格_python爬取历史所有股票价格

1. 如何选取过去每个月股票的市值 python

类似,可以修改一下股票涨跌幅数据是量化投资学习的基本数据资料之一,下面以python代码编程为工具,获得所需要的历史数据。

主要步骤有:(1) #按照市值从小到大的顺序活得N支股票的代码;(2) #分别对这一百只股票进行100支股票操作;(3) #获取从2016.05.01到2016.11.17的涨跌幅数据;(4) #选取记录大于40个的数据,去除次新股;(5) #将文件名名为“股票代码.csv”。具体代码如下:# -*- coding: utf-8 -*-"""Created on Thu Nov 17 23:04:33 2016获取股票的历史涨跌幅,并分别存为csv格式@author: yehxqq151376026"""import numpy as npimport pandas as pd#按照市值从小到大的顺序活得100支股票的代码df = get_fundamentals(query(fundamentals.eod_derivative_indicator.market_cap).order_by(fundamentals.eod_derivative_indicator.market_cap.asc()).limit(100),'2016-11-17', '1y')#分别对这一百只股票进行100支股票操作#获取从2016.05.01到2016.11.17的涨跌幅数据#选取记录大于40个的数据,去除次新股#将文件名名为“股票代码.csv”for stock in range(100):priceChangeRate = get_price_change_rate(df['market_cap'].columns[stock], '20160501', '20161117')if priceChangeRate is None:openDays = 0else:openDays = len(priceChangeRate)if openDays > 40:tempPrice = priceChangeRate[39:(openDays - 1)]for rate in range(len(tempPrice)):tempPrice[rate] = "%.3f" %tempPrice[rate]fileName = ''fileName = fileName.join(df['market_cap'].columns[i].split('.')) + '.csv'fileNametempPrice.to_csv(fileName)。

2. 请问怎样用Java获取股票行情历史数据

public class StockConnection {

public static void main(String[] args) {

URL ur = null;

try {

//搜狐股票行情历史接口

// ur = new URL("/hisHq?code=cn_300228&start=20130930&end=20131231&stat=1&order=D&period=d&callback=historySearchHandler&rt=jsonp");

//新浪股票行情历史接口

ur = new URL(".cn/stock/flash_hq/kline_data.php?&rand=random(10000)&symbol=sh600000&end_date=20150809&begin_date=20000101&type=plain");

HttpURLConnection uc = (HttpURLConnection) ur.openConnection();

BufferedReader reader = new BufferedReader(new InputStreamReader(ur.openStream(),"GBK"));

String line;

while((line = reader.readLine()) != null){

System.out.println(line);

}

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}

Python可以使用第三方库requests和BeautifulSoup来爬取网页数据,并使用pandas库进行数据处理和分析。具体步骤如下: 1. 安装必要的第三方库:requests、BeautifulSoup和pandas。 2. 使用requests库获取目标网页的HTML源代码。 3. 使用BeautifulSoup库解析HTML源代码,提取所需数据。可以通过Chrome浏览器的开发者工具查看HTML源代码,确定需要提取的元素。 4. 将提取到的数据存储到pandas的DataFrame中。 5. 对DataFrame进行必要的数据清洗和处理,比如将字符串转换为数字类型等。 6. 可以使用matplotlib库进行可视化分析,绘制股票历史价格走势图等。 以下是示例代码,供参考: ```python import requests from bs4 import BeautifulSoup import pandas as pd # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 股票代码 stock_code = '600519' # 构造URL url = f'https://finance.sina.com.cn/realstock/company/{stock_code}/hisdata/klc_kl.shtml' # 发送请求 response = requests.get(url, headers=headers) # 解析HTML源代码 soup = BeautifulSoup(response.text, 'html.parser') # 获取表格数据 table = soup.find('table', class_='datatbl') rows = table.find_all('tr') # 将表格数据存储到DataFrame中 data = [] for row in rows[1:]: cols = row.find_all('td') cols = [col.text.strip() for col in cols] data.append(cols) df = pd.DataFrame(data, columns=['日期', '开盘价', '最高价', '最低价', '收盘价', '涨跌额', '涨跌幅', '成交量(手)', '成交金额(万元)']) # 数据清洗和处理 df['日期'] = pd.to_datetime(df['日期'], format='%Y-%m-%d') df[['开盘价', '最高价', '最低价', '收盘价', '涨跌额', '涨跌幅', '成交量(手)', '成交金额(万元)']] = df[ ['开盘价', '最高价', '最低价', '收盘价', '涨跌额', '涨跌幅', '成交量(手)', '成交金额(万元)']].apply(pd.to_numeric) # 可视化分析 import matplotlib.pyplot as plt plt.plot(df['日期'], df['收盘价']) plt.xlabel('日期') plt.ylabel('收盘价') plt.title('股票历史价格走势图') plt.show() # 相关问题: # 1. requests库是什么? # 2. BeautifulSoup库是什么? # 3. pandas库是什么? # 4. 如何对DataFrame进行数据清洗和处理? # 5. 如何使用matplotlib库绘制股票历史价格走势图?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值