Python数据分析
Python数据分析
狮子王量化
量化投资
展开
-
【Python】Pandas通过索引的方式去重df[~df.index.duplicated()]
~df.index.duplicated() 方法是只针对索引做去重,而不考虑列数据,与df.drop_duplicates() 相反。原创 2022-12-06 17:07:20 · 2716 阅读 · 0 评论 -
【Python】Pandas列名与值对齐显示,Pandas显示所有行和列,Pandas不换行显示
1.列名与值不对齐:2.设置:原创 2021-06-18 10:36:20 · 7470 阅读 · 0 评论 -
【Python】Pandas DataFrame 删除带有特定值的行,两个表格的数据对齐
1.问题两个数据表,长度不一样。第一个表格中的数据比第二个表格中多出些行,要以第二个表格的数据为准,删掉第一个表格中多余的数据。2.解决思路两个数据的第一列,也就是时间 ['DateTime'] 格式是一样的,先遍历,对比两个表格中不一致的时间,将不一致的加入到一个列表 DateTime 里。close = pd.read_csv(r'C:\Users\admin\Desktop\wind_data\sz_hs_close.csv', encoding='utf-8',engine='p.原创 2022-02-17 14:20:58 · 2639 阅读 · 0 评论 -
【Python】np.polyfit 和 np.polyld多项式拟合、求各项系数、求导,并画图
1.定义初始数据#!/usr/bin/env python# coding:utf-8import numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']X = np.array([1, 2, 3, 4, 5, 6])Y = np.array([2.3, 3.5, 4.2, 5.1, 6.5, 8.3])2.多项式拟合,使用np.polyfit得到对应阶数的拟合原创 2022-01-12 09:17:36 · 8308 阅读 · 2 评论 -
【Python】根据多个列同时进行多条件筛选数据
# 多条件筛选时,每个条件都要()括起来print(data[(data['a'] == 2) & (data['b'] == 5)])原创 2022-01-05 16:06:48 · 3673 阅读 · 0 评论 -
【Python量化交易】分析个股相关性以及显示股票归一化的涨跌幅收益率(包含完整代码)
在构建投资组合时,组合里个股之间的相关性会直接影响到投资组合的波动率。个股之间的相关性越低,投资组合越文件。因此分析个股的相关性是很有必要的。首先拿到这些数据:原创 2021-06-18 11:02:57 · 6299 阅读 · 4 评论 -
【Python】pandas得到某个值对应的行的索引
index = df[df["列名"]== "对应的值"].index.tolist()[0]原创 2020-12-09 09:48:13 · 8703 阅读 · 0 评论 -
【Python】明明保存数据前都很好,保存之后格式却变了???操作excel,writer.save()保存之后 float变成date.time
1.问题使用Python的openpyxl库操作Excel数据文件,数据格式是float类型,在处理过程中数据都很正常,结果保存之后数据格式变成了时间格式:date.time。一直以为是Python代码写得有问题,找了很多资料都无法解决。直到详细地看了每操作一次之后,数据格式的变化,发现在writer.save()保存之前数据格式都是保持float格式,保存之后直接变成date.time格式。于是判断会不会是Excel本身的问题,直到找到一篇资料:excel表格保存之后再次打开全部变成日期原创 2020-10-21 10:36:19 · 2592 阅读 · 0 评论 -
【Python量化交易】计算合约组合购买方案,每种合约应该买多少张?一共有多少种购买方案?
1.问题目前有2种合约,一种价格1620元一张,另一种1100元一张。如果我想买9000-10000块钱的合约,那么这两种合约我每种应该买多少张?一共有多少种组合方案?2.代码# -*- coding: utf-8 -*-contract_a = 1620contract_b = 1100for i in range(10): for j in range(10): if 9000 < contract_a * i + contract_b * j .原创 2020-08-13 12:14:58 · 1779 阅读 · 0 评论 -
【Python量化交易】pandas中shift(1)的用法
import pandas as pdimport tushare as tsdata = ts.get_hist_data('601688', '2017-06-01')#用tushare获取行情data = data.sort()#对数据进行排序df = pd.DataFrame()#创建一个新的DataFramedf['close'] = data['close'] # 新Da...转载 2019-10-11 10:26:15 · 14451 阅读 · 0 评论 -
【Python量化交易】Windows下安装TA-Lib百分百成功的教程
TA-lib,是一个py量化交易的技术分析库,里面包含了大部分主流的技术指标,各种大型的开源量化框架,都会内置这个库。这篇文章分享如何安装TA-lib。1.找到并下载自己需要的对应版本的whl格式文件。(如:若本机安装是32位的python3.6,则选TA_Lib‑0.4.17‑cp36‑cp36m‑win32.whl下载;若本机安装的是64位的python2.7,则选择TA_...原创 2019-08-09 22:54:16 · 3150 阅读 · 1 评论 -
【Python量化交易】13行Python代码编写微信数字货币报价机器人
import itchatimport requests#获取价格def get_price(symbol): request = requests.get("https://api.hbdm.com/api/v1/contract_index?symbol="+symbol).json() price = request["data"] for item in ...原创 2019-08-26 01:25:44 · 1818 阅读 · 0 评论 -
【Python数据分析】numpy基本使用方法之二
#布尔值索引names = np.array(['Bob','Joe','Will','Bob','Will','Joe','Bob']) #7个数据的数组data = np.random.random((7,4)) #随机生成7*4的数组print(data)print('---------------------------------------------------...原创 2018-07-23 23:51:31 · 521 阅读 · 0 评论 -
【Python数据分析】苹果公司股票数据分析,数据源免费送
首先我们打开数据之后先了解一下数据有哪些元素。在这个表中,可以看到,第一列是公司名称,第二列是交易日期,第四列是开盘价,之后分别是是最高价,最低价,收盘价,成交量。(数据获取方式看文章末尾)在这个例子中,将会利用python和numpy库进行苹果公司的股票交易数据的分析。先读入数据文件:import sysimport numpy as np#读入文件c,v = np.lo...原创 2018-07-31 23:40:27 · 4091 阅读 · 7 评论 -
【Python数据分析】pandas基本操作
pandas里的数据结构Series(类似于一维数组---有索引的一维数组)- 数组与标签- 可以通过标签选取数据- 定长的有序字典DataFrame- 表格型数据结构- 行索引、列索引import numpy as npimport pandas as pdimport sysfrom pandas import Series,DataFrame#Series...原创 2018-08-05 23:44:58 · 506 阅读 · 0 评论 -
【Python数据分析】利用pandas处理缺失数据
一、缺失数据pandas中使用浮点值NaN(Not a Number)来表示浮点或非浮点数组中的缺失数据。pandas as pdimport numpy as npfrom pandas import Series,DataFramedata = Series(['a','b',np.NAN,'d'])data#输出:0 a1 b2 NaN...原创 2018-08-27 17:19:48 · 987 阅读 · 0 评论 -
【Python数据分析】波士顿房价分析小例子
一、导入模块%matplotlib inline #将生成的图片嵌入网页中import matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.feature_selection import SelectKBest,f_regressionfrom sklearn.linear_mod...原创 2018-09-03 18:05:55 · 13152 阅读 · 6 评论 -
【Python数据分析】——药品销售数据分析(完整项目实战)
一、前言这篇文章找来了有关药品销售数据进行案例分析练习,利用适当的统计方法对相关数据进行月均消费次数、月均消费金额、客单价和消费趋势等几个业务指标进行分析。分析过程为:数据获取、数据清洗、建模分析、可视化二、数据获取(文末有数据获取方式)这是我们的原始数据,xlsx格式导入相关的包并读取数据,读取的时候用object读取,防止有些数据读取不了。接着可以查看数据的...原创 2018-09-18 00:42:50 · 24854 阅读 · 26 评论 -
【Python数据分析】房价数据分析实战(包含源码和数据)
今天我们利用波士顿房价进行简单分析,快速熟悉数据挖掘和分析的一般流程。1.导入数据。2.查看数据维度,从结果可以出,该数据一共有506条记录,14个特征,然后再输出特征的名字和数据类型。3.然后用.head()函数输出前面5条数据,初步查看数据的基本内容。4.接着用.describe()函数进行数据的描述性分析,查看每一列(也就是每一个特征的数据)的条数、平均值、最大...原创 2018-12-15 20:51:49 · 17584 阅读 · 6 评论 -
【Python数据分析】numpy的基本使用方法
import numpy as npc=[]def numpysum(n): #0到(n-1)的列表 a=np.arange(n)**2 #生成一个0到(n-1)的列表,每个项再平方 b=np.arange(n)**3 #生成一个0到(n-1)的列表,每个项再进行3次方 c=a+b #两个列表相加 return cc...原创 2018-07-23 23:43:33 · 518 阅读 · 0 评论