用type()查看数据类型 : type(数据)
函数名称 描述 type() 返回参数的数据类型 dtype 返回数组中元素的数据类型 astype() 对数据类型进行转换
for用于遍历一个序列, 故遍历的对象必须要是一个序列, 序列包含的数量类型有tuple,list, dict,dict_keys'([]), 'dict_values'([]),series, array(不建议用)
数据类型: int, float, str, tuple,list, dict, Series, DataFrame, np.ndarray
数据类型的转化函数: int, float, str, tuple,list, dict, Series, DataFrame,array
转化函数: 对象的数据类型 用法 int float, str(数字型字符串) int(数据) float int, str(数字型字符串) float(数据)
str int, float str(数据) tuple list,series, dict_keys'([]), 'dict_values'([]) dict series list tuple,series, dict_keys'([]), 'dict_values'([]) Series pd.Series() DataFrame pd.DataFrame() array 'dict_keys', 'dict_values', np.array() ; class 'pandas.core.series.Series'>即是series数据类型
如df.value_counts()可得此数据类型
函数对象的数据类型:
len(data) : data类型:tuple,list, dict,str; 还有ndarray(不建议用)
处理Series,DataFrame数据类型的常用函数有: 默认axis=0; 即:列
df.count(axis=0/1): 某列/行非空值计数 class 'pandas.core.series.Series'>
df.sum(axis=0/1) : 某列/行数据进行求和 返回的数据类型: float
df.mean() :某列/行求数据均值 返回的数据类型: float
df.max() 返回的数据类型: float
df.min() 返回的数据类型: float
df.median() 返回的数据类型: float
df.mode() : 求众数 返回的数据类型: float
df.var() : 求方差 返回的数据类型: float
df.std() : 求标准差 返回的数据类型: float
df.quantile(0.25,0.5,0.75) : 求分位数, df.quantile(0.5) == df.median() 返回的数据类型: float
df.corr() :相关性运算, 返回一个相关系数矩阵
df['a'].corr(df['b']) : 求列a与列b的相关系数
df.value_counts(normalize=False/True) : 返回某一列的分类不同的变量的个数, normalize=True是以百分数形式返回 class 'pandas.core.series.Series'>