自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 练习:去除df某列里面字符串里面的空格, .str.strip(); series.str.replace(); df.replace()

df[ ].str.strip( )先创建带有空格的df:df = pd.DataFrame({'Company':['company A','company B','company C','company A'], 'Sales':['Peter ',' Amy','John ','Mi ke']})dfOut[38]: ...

2020-03-28 14:52:10 11159 1

转载 Pandas的数据重塑-pivot与pivot_table函数

liao.cpython.org/pandas28/pandas.pivot的重点在于reshape, 通俗理解就是合并同类项,所以在行与列的交叉点值的索引应该是唯一值,如果不是唯一值,则会报,即原始数据集中存在重复条目,此时pivot函数无法确定数据透视表中的数值即会报错ValueError: Index contains duplicate entries, cannot reshape...

2020-03-27 16:07:21 706

转载 pandas merge:默认是inner join

http://liao.cpython.org/pandas27/merge函数默认拼接数据是inner join即内连接。先构造两个df, 含有相同的1列列名:col1 = 'class_name class_id class_lecturer'.split()col2 = 'class_id stu_id'.split()val1 = [['IT',100,'Wangli'],...

2020-03-27 15:17:49 4643

转载 pandas: pd.concat([df1,df3],axis默认=0纵向拼接),concat常用于纵向拼接,默认outer join

http://liao.cpython.org/pandas26/http://liao.cpython.org/pandas25/https://blog.csdn.net/weixin_37226516/article/details/64134643两个Series的拼接,默认是在列上(往下)拼接,axis = 0,如果要横向往右拼接,axis = 1concat(objs, a...

2020-03-27 10:14:48 6067

转载 Pandas的数据清洗-,查看.isnull,.notnull(); .dropna(how = 'all',axis = 1, thresh = 2);.fillna(method)

http://liao.cpython.org/pandas20/http://liao.cpython.org/pandas21/构造一个NaN的dfval = np.arange(10,38).reshape(7,4)col = 'a b c d'.split()idx = 'this is just a fake practise today'.split()df = pd....

2020-03-26 15:32:16 1628

转载 DataFrame列操作:.rename, 增加列by [ ], insert

http://liao.cpython.org/pandas13/rename修改列名字:对一个dataframe的数据使用rename函数后返回新的dataframe,不影响原dataframe。如果想直接影响本dataframe,可以使用参数inplace设置为True。df1.rename({'ax':'a','bx':'b'},inplace = True)df1.head(...

2020-03-25 16:56:58 402

转载 DataFrame 的访问:[]选择列,[[]]选择多列,loc[]选择行,loc[[]]选择多行,iloc[],at[],iat[],ix[],loc[]行列切片,布尔选择

http://liao.cpython.org/pandas10/[]选择列:DataFrame使用了[ ]则是选择了一个字段所有数据即一列,而Series则是会得到某行的数据。val = np.arange(10,40).reshape(10,3)idx = 'ax bx cx'.split()df1 = pd.DataFrame(val,columns = idx)df1['a...

2020-03-25 16:08:23 23798 2

转载 DataFrame属性 .columns,.shape, .size, .values, .dtypes, .ndim, .T

http://liao.cpython.org/pandas09/.columnscrm.columnsOut[195]: Index(['Team', 'Task(created date)', 'Phone Calls (created date)', 'Visits (created date)', 'Leads(created date)', 'O...

2020-03-25 15:25:50 6674 1

转载 series统计函数 .sum(), .mean(), .describe(), .max(), .idxmax(),.min(),.idxmin()

http://liao.cpython.org/pandas07/t.sum()t.mean()mean函数可以得到均值μμ,这时需要注意的是如果values里含有NaN,可以使用mean函数的参数避开NaN,默认情况下启用了skipna=True避开NaN值,如果需要考虑NaN可以使skipna=False,那么均值里是考虑了NaN项的,实际工作中是忽略掉的。t.mean(ski...

2020-03-25 14:01:18 962

转载 series的add,append,count,sort_index,sort_values,reset_index,reindex

http://liao.cpython.org/pandas06/v1 = [10,20,30,25]v2 = [1,3,6,7]idx = 'k i s t'.split()s1 = pd.Series(v1,index = idx)s2 = pd.Series(v2,index = idx)series 的add & appendadd: add函数可以将othe...

2020-03-25 12:08:34 1342 1

转载 Series idx & name; Series index的使用,切片,读取数据,增加,布尔选择

http://liao.cpython.org/pandas03/总结一下:创建Series的实例对象,有两种方式:一种是不指定Series构造函数的index,会自动有一个位置信息的index从0~len() -1自动为这个Series对象分配。另一种方式是常用字符列表作为Series对象的各个数据的标签label。idx = 'a b c d e'.split()v = [11,12...

2020-03-25 11:27:00 612

转载 pandas 之 groupby,【matplotlib】plot()kind参数表,groupby

https://www.jianshu.com/p/42f1d2909bb6a ={'Sex':pd.Series(['male','female','male','male','male','female']), 'area':pd.Series(['Shanghai','Beijing','Jiangsu','Shanghai','Zhejiang','Zhejiang','Sh...

2020-03-21 14:03:27 4390

转载 pandas数据结构 DataFrame 方法链assign(),索引/选择

https://www.pypandas.cn/docs/getting_started/dsintro.html#dataframe用方法链分配新列dic = {'SepalLength':[5.1,4.9,4.7,4.6,5.0],'SepalWidth':[3.5,3.0,3.2,3.1,3.6],'PetalLength':[1.4,1.4,1.3,1.5,1.4], ...

2020-03-20 22:43:58 1865

转载 pandas数据结构 DataFrame

DataFramehttps://www.pypandas.cn/docs/getting_started/dsintro.html#dsintroDataFrame 是由多种类型的列构成的二维标签数据结构,类似于 Excel 、SQL 表,或 Series 对象构成的字典。DataFrame 是最常用的 Pandas 对象,与 Series 一样,DataFrame 支持多种类型的输入数...

2020-03-20 21:46:10 306

转载 数据结构 pd.Series

数据结构简介https://www.pypandas.cn/docs/getting_started/10min.htmlSeriesSeries 是带标签的一维数组,可存储整数、浮点数、字符串、Python 对象等类型的数据。轴标签统称为索引。调用 pd.Series 函数即可创建 Series:用值列表生成 Series 时,Pandas 默认自动生成整数索引:s = pd....

2020-03-20 13:36:25 2141

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除