import pandas as pd
s1 = pd.Series([‘短裤’, ‘毛衣’, ‘连衣裙’, ‘牛仔裤’], index = [‘a001’, ‘a002’, ‘a003’, ‘a004’])
print(s1)
import pandas as pd
s2 = pd.Series({‘a001’:‘短裤’, ‘a002’:‘毛衣’, ‘a003’:‘连衣裙’, ‘a004’:‘牛仔裤’})
print(s2)




读取某个工作表的数据


指定读取数据的行标签

读取指定列
data = pd.read_excel('订单表.xlsx',sheet_name=3,index_col=0)
print(data)
#
# data = pd.read_excel('订单表.xlsx',sheet_name=3,index_col=1)
# print(data)
data = pd.read_excel('订单表.xlsx',sheet_name=3,usecols=[2])
print(data)
# 读第2列和第4列
data = pd.read_excel('订单表.xlsx',sheet_name=3,usecols=[1,3])
print(data)

读取csv文件

读取前几行

查看数据的类型

查看某一列的数据类型

转换数据的类型
astype()

import tushare as ts
import pandas as pd
tianye = ts.get_k_data(code = '600807', start = '1994-01-01')
# 获取1994年1月1日到今天的所有交易数据,start用来获取数据时间
print(tianye)
tianye.to_csv('tianye.csv')
# 获取的数据存储为csv文件
Tianye = pd.read_csv('tianye.csv', index_col = 'date', parse_dates = ['date'])
# 读取文件,将data列作为行标签,并且将列数据转换为日期类型
print(Tianye)
Tianye = Tianye['2010':'2019']
# 近十年的数据
month_first = Tianye.resample('M').first()
# 获取每一天的股票数据 resample代表重新取样,M代表岸月分组,firt()每月的第一天,last每月的醉胡一天
month_first_money = month_first['open'].sum() * 1000
# 计算每月第一天以开盘价买入1000股该股票总支出
month_max = Tianye.resample('M').last()
# 获取每一月最后一天的股价数据
month_max_money = month_max['close'].sum() * 1000
# 计算每月最后一天以收盘价卖出的总能高收入
get_money = month_max_money-month_first_money
# 计算10年的收益
print(get_money)

tushare获取股票历史数据
相关性分析
获取日K线级别的股票数据
get_hist_data()函数可获取日K线级别的股价数据
爬虫
按照一定的规则自动地从网页上抓取数据地代码或脚本,它能模拟浏览器上抓取数据的代码或脚本,能模拟浏览器对存储指定网页的服务器发起请求,从而获得网页的源代码,再从源代码中提取出需要的数据。
认识网页结构
查看网页的源代码
SHIFT+CTRL+I
< div> 标签
< ul >标签:无需
<ol>标签:有序
<li>列表中的一项
4710

被折叠的 条评论
为什么被折叠?



