表1:SKU基本信息表(jdata_sku_basic_info)
1. 读取数据,并获取部分特征的最大值,最小值,均值和中位数
2. df.info()给出DataFrame数据的基本信息
4. df.column.value_counts() 以Series形式返回指定列的不同取值的频率
value_count() 的参数:
(1) normalize : boolean, default False 如果为True,则返回的对象将包含唯一值的相对频率。
sort : boolean, default True 按值排序
ascending : boolean, default False 按频率计数升序排序
bins : integer, optional 而不是数值计算,把它们分成半开放的箱子,一个方便的pd.cut,只适用于数字数据
dropna : boolean, default True 不包括NaN的数量。