自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 使用loc进行数据过滤

df.loc[(df[“height”]>=180) & (df[“weight”]>=80),“xinlie”]=“high”df.loc[(df[“height”]<=180) & (df[“height”]>=170) &(df[“weight”]<=80) & (df[“weight”]>=70),“xinlie”]=“msize”df.loc[~(((df[“height”]>=180) & (df[“weig.

2020-11-30 10:48:00 454

原创 loc与iloc

当用行号索引的时候, 尽量用 iloc 来进行索引; 而用标签索引的时候用 loc1.loc意义:通过行标签索引行数据例: loc[n]表示索引的是第n行(index 是整数)loc[‘d’]表示索引的是第’d’行(index 是字符)2. .iloc :通过行号获取行数据,不能是字符loc 可以通过行号和行标签进行索引,比如 df.loc[‘a’] , df.loc[1],而iloc只能通过行号索引 , df.iloc[0] 是对的, 而df.iloc[‘a’] 是错误的...

2020-11-30 10:32:46 521 1

原创 missing value

pandas使用numpy.nan来代表缺失值,缺失值不会计算,通常处理的方式为:删除含有缺失值的行,补充缺失值1、检测缺失值,返回布尔值df.isnull(df[“height”])2、删除缺失值df.dropna()官方函数说明:DataFrame.dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)3、补充缺失值DataFrame.fillna(value=None, method=None, axis=

2020-11-30 10:05:07 372

原创 dataframe数据选取、添加、删除

1、选择列数据df[‘列名1’,‘列名2’]2、增加列,增加列每次只能增加一列df[“新列名”]=1df[“新列名” ]3、 条件筛选df[“height”]>150 | df[“weight”]<50索引筛选数据df[df[“height”]>150 | df[“weight”]<50]5、删除列del df[“列名”]axis=0,针对列axis=1,针对行...

2020-11-30 09:33:48 367

原创 filter与Lambda函数

filter与Lambda函数filter函数filter函数是作用在序列元素上,返回布尔值,根据布尔值true或false进行元素的保留或删除2.lambda函数可以直接当做一个变量保存使用,也可直接使用f=lambda(s:s *2)x=[1,2,3,4]map(f,x)x=[1,2,3,4,5,6,7,8,9,10]list(filter(lambdas:s%2==0,x))...

2020-11-29 17:03:36 766

原创 【1】数据读取和dataframe

数据读取不要尝试读取excel文件,读取.csv格式或txt格式文件;注意编码问题,使用encoding参数;import pandas as pdpd.read_csv(‘D:/project/python_instruct/test_data1.csv’)import pandas as pddata1 = pd.read_csv(‘rating.csv’)data2 = pd.read_csv(‘rating.csv’,header=None)data3 = pd.read_csv(.

2020-11-29 16:46:00 264

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除