-
series数据类型函数
#求中位数 median_points = reviews.points.median() #列出不同的值 countries = reviews.country.unique() #出现过的次数 reviews_per_country = reviews.country.value_counts() #求平均数 centered_price = reviews.price.mean() #求第一个最大值出现的indexidxmin最小,argmin、argmax为别名 argain_idx = (reviews.points / reviews.price).idxmax()
-
修改DataFrame
#某列的数据类型 dtype = reviews.points.dtype #改变数据类型 point_strings = reviews.points.astype(str) #获取为空的数据 n_missing_prices = reviews.price.isnull().sum() #fill空值,mode()[0]用众数填充 reviews.region_1.fillna('Unknown',inplace = True) #size求各个分组的数据数量,sort_values排序 reviews_per_region = reviews.groupby('region_1').size().sort_values(ascending = False)
-
重命名、组合
字典方式,重命名列