数据分析
1、类型
① 列表
索引:list[i];长度:len(list);
增:list.append(x),list.insert(2,x)#2为索引值,x为增加的数据;
删:list.remove(x);
改:list[0]=x;查:list[3]、list[1:3]#前闭后开、list[-1];
遍历:
for index in range(len(list)):
print(index,':',list[index])
② 字典
长度:len(dic);键:dic.keys();值:dic.values();
增:dic[‘y’]=x #y为新增的键,x为新增的键对应的值;
删:dic.pop[‘x’];改:dic[‘x’]=2;
查:dic.get[‘x’] #若没有x就会报错;
dic.get[‘x’,‘no found’] #若没有x就会返回‘no found’,不会报错;
遍历:
for key in dic:
print(key,':',dic[key])
③ while
while(x>5):
if x=1:
******
elif x=2:
******
elif x=3:
******
elif x=4:
******
else:
******
④ 函数
def test(a,b):#无返回
print(a,b)
def Test(A,B):#有返回
return A,B
⑤ 模块
import TEST#TEST为调用的模块
2、数据变换
① 查询file中的’A‘列为空的数据
file[file['A'].idnull()].head()
② 缺失值处理
avg_age=file['Age'].mean()#求’Age'列的均值
file['new_Age']=file[file['Age'].isnull()].fillna(avg_age)#将file中Age列为空的填充为均值放到新建的new_Age列
file[file['new_Age'].isnull()]['Age','new_Age'].head()#查看file中Age列为空的数据行的Age,new_Age列
③ 删除某些字段
file.drop(['Age','new_Age'],axis=1)#删除Age,new_Age列
④ 构造新列
file(['new_column']=file['Age']+file['new_Age']#构造一个新列为Age,new_Age列的和
3、数据便利
① 索引 file.loc[index,列名]
for index in file.index:
pass_id=file.loc[index,'new_Age']
sex=file.loc(index,'Age']
print(pass_id,sex)
② 构造新列:
未完。