python数据分析
巧克力酱人
Hello World
展开
-
【Python绘图】柱状图
柱状图的一些画法原创 2022-02-19 11:25:25 · 4155 阅读 · 0 评论 -
【利用python进行数据分析】chapter12:numpy高级应用
十一章是金融方面应用,因为我不学无术,所以就不写了。终于最后一章了,哈哈哈!1.ndarray对象首先ndarray对象包含四部分:一个指向数组的指针数据类型或dtype表示数组形状(shape)的元组一个跨度元组(跨度貌似是步长之类的东西,比如一个list a,求a[::2]隔一步选一个2.一些高级操作#数组重塑import numpy as nparr = np.arange(8)arr# array([0, 1, 2, 3, 4, 5, 6, 7])arr.resha原创 2021-02-16 21:59:45 · 121 阅读 · 0 评论 -
【利用python进行数据分析】chapter10:时间序列
一些和日期、时间等有关的内容1.日期和时间数据类型及工具from datetime import datetime as dtnow = dt.now()now# datetime.datetime(2021, 2, 16, 16, 55, 23, 636760)now.year,now.month,now.day #分别查询年月日(2021, 2, 16)#delta查询两个datetime对象之间的时间差delta = dt(2011,1,7)-dt(2008,6,24,8,15)原创 2021-02-16 19:11:08 · 116 阅读 · 2 评论 -
【利用python进行数据分析】chapter9:数据聚合与分组运算
1.groupby分组函数,依据某个变量进行分组df = DataFrame({'key1':['a','a','b','b','a'],'key2' : ['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.randn(5)})grouped = df['data1'].groupby(df['key1']) #按照key1对data1进行分组,grouped存储的是中间量,可以直接对grouped原创 2021-02-16 10:26:52 · 187 阅读 · 0 评论 -
【利用python进行数据分析】chapter8:绘图和可视化
1.Figure和Subplotmatplotlib的图像都位于Figure对象中,可以用plt.figure创造一个对象import matplotlib.pyplot as pltfig = plt.figure() #此时还是一个空白的窗口,如果不弹出这个窗口的话,可以使用fig.show() # 手动弹出空白窗口,先不要关闭,否则下面的ax都不能画到fig上了# 空白的fig是不可以绘画的,必须创建subplot才可以绘图ax1 = fig.add_subplot(2,2,1) #将原创 2021-02-15 16:52:35 · 255 阅读 · 1 评论 -
【利用python进行数据分析】chapter7:数据处理
1.合并数据集出发点:数据集的合并或连接是通过一个或多个键将行链接起来的df1 = DataFrame({'key':['b','b','c','d','a','a'],'data1':range(6)})# key data# 0 b 0# 1 b 1# 2 c 2# 3 d 3# 4 a 4# 5 a 5df2 = DataFrame({'key':['b','c','d','a'],'data2':ran原创 2021-02-14 19:17:45 · 168 阅读 · 2 评论 -
【利用python进行数据分析】Chapter6:数据加载
1.csv的存取import pandas as pd#直接读取csvdf = pd.read_csv('data.csv')#读取,指定分隔符df = pd.read_table('data.csv',sep=',') #分隔符是,#当有的table的分隔符不固定的时候,可以使用正则表达式来代表分隔符res = pd.read_table('a.txt',sep = '\s+')#分隔符是不同长度的空格符时#读取csv的时候,指定列名df = pd.read_csv('data.csv原创 2021-02-13 11:59:54 · 153 阅读 · 1 评论 -
【利用python进行数据分析】chapter4:pandas
Series一种类似于一维数组的对象,由数据和索引组成,当不指定索引时,默认的索引是从0到n-1import pandas as pdfrom pandasobj = Series([1,2,3,4])#obj# 0 1# 1 2# 2 3# 3 4# dtype: int64#查询这个series的值obj.values# array([1, 2, 3, 4], dtype=int64)obj.index# RangeIndex(start=0, st原创 2021-02-11 20:30:44 · 217 阅读 · 4 评论 -
【利用python进行数据分析】Chapter3:numpy基础
创建数组# create a new ndarray based on existed lista = [1,2,3,4,5]arr = np.array(a)# the dimension of ndarrayarr.ndim# the shape of ndarrayarr.shape# the data type of ndarrayarr.dtype# create a ndarray of all zeros with a specified shapenp.zeros(.原创 2021-02-08 20:46:12 · 169 阅读 · 0 评论