一、在数据集中随机取数
ufo.sample()
利用此方法可以划分训练集和测试集。比如随机取75%的数据作为训练集,剩下的25%作为测试集:
二、How to create dummy variables in pandas?
method1:
method2(更简洁):
将dummy columns加入到原来的DataFrame:pd.concat()
bonus:最简洁的写法!
三、How to work with dates and times in pandas?
example1:
example2:
转换成日期类型的好处:更方便的处理日期,比如:
ufo.Time.dt.weekday_name
ufo.Time.dt.weekday
ufo.Time.dt.dayofyear
example3:时间戳
example4:数学操作
bonus:统计每年ufo报道的次数并绘图(可视化)
四、How to find and remove duplicate rows in pandas?
keep=False:查看所有重复的rows
删除重复:drop_duplicates()