![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
蜜瓜与车厘子
这个作者很懒,什么都没留下…
展开
-
使用loc进行数据过滤
df.loc[(df[“height”]>=180) & (df[“weight”]>=80),“xinlie”]=“high”df.loc[(df[“height”]<=180) & (df[“height”]>=170) &(df[“weight”]<=80) & (df[“weight”]>=70),“xinlie”]=“msize”df.loc[~(((df[“height”]>=180) & (df[“weig.原创 2020-11-30 10:48:00 · 431 阅读 · 0 评论 -
loc与iloc
当用行号索引的时候, 尽量用 iloc 来进行索引; 而用标签索引的时候用 loc1.loc意义:通过行标签索引行数据例: loc[n]表示索引的是第n行(index 是整数)loc[‘d’]表示索引的是第’d’行(index 是字符)2. .iloc :通过行号获取行数据,不能是字符loc 可以通过行号和行标签进行索引,比如 df.loc[‘a’] , df.loc[1],而iloc只能通过行号索引 , df.iloc[0] 是对的, 而df.iloc[‘a’] 是错误的...原创 2020-11-30 10:32:46 · 485 阅读 · 1 评论 -
missing value
pandas使用numpy.nan来代表缺失值,缺失值不会计算,通常处理的方式为:删除含有缺失值的行,补充缺失值1、检测缺失值,返回布尔值df.isnull(df[“height”])2、删除缺失值df.dropna()官方函数说明:DataFrame.dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)3、补充缺失值DataFrame.fillna(value=None, method=None, axis=原创 2020-11-30 10:05:07 · 350 阅读 · 0 评论 -
dataframe数据选取、添加、删除
1、选择列数据df[‘列名1’,‘列名2’]2、增加列,增加列每次只能增加一列df[“新列名”]=1df[“新列名” ]3、 条件筛选df[“height”]>150 | df[“weight”]<50索引筛选数据df[df[“height”]>150 | df[“weight”]<50]5、删除列del df[“列名”]axis=0,针对列axis=1,针对行...原创 2020-11-30 09:33:48 · 344 阅读 · 0 评论 -
filter与Lambda函数
filter与Lambda函数filter函数filter函数是作用在序列元素上,返回布尔值,根据布尔值true或false进行元素的保留或删除2.lambda函数可以直接当做一个变量保存使用,也可直接使用f=lambda(s:s *2)x=[1,2,3,4]map(f,x)x=[1,2,3,4,5,6,7,8,9,10]list(filter(lambdas:s%2==0,x))...原创 2020-11-29 17:03:36 · 747 阅读 · 0 评论 -
【1】数据读取和dataframe
数据读取不要尝试读取excel文件,读取.csv格式或txt格式文件;注意编码问题,使用encoding参数;import pandas as pdpd.read_csv(‘D:/project/python_instruct/test_data1.csv’)import pandas as pddata1 = pd.read_csv(‘rating.csv’)data2 = pd.read_csv(‘rating.csv’,header=None)data3 = pd.read_csv(.原创 2020-11-29 16:46:00 · 259 阅读 · 0 评论