机器学习——KNN算法 准备数据# 实例化模型knn=KNeighborsClassifier(n_neighbors=3) # k=3选取要预测的值在内的周围三个出现次数最多的类别# 模型训练# 模型预测。
数据可视化 通过发现上面绘制过程其实很简单,就是通过特定的API,数据.plot.对应的绘制图形函数,举例:hist直方图,line折线图,box箱线图,area面积图,pie饼图,scatter散点图,kde和密度估计图等,后面会详细介绍的哦参数解释:figsize画布大小,fontsize字体大小,kind图形种类,
Pandas日期时间类型 Pandas关于日期时间的数据 有如下几种数据类型TimeDelta64 两列时间的差值 → TimeDeltaIndexDatetime64 一列时间数据 →DatetimeIndexTimeStamp 时间戳 就是一个时间点如果数据中包含了日期时间的数据, 并且后续计算/数据的处理需要用到日期时间类型数据的特性需要把他转换成日期时间类型pd.to_datetime(一列数据)pd.read_csv(parse_dates= [列名/序号]) 加载的时候直接进行转换。
Pandas基础点总结 pandas是用于数据分析的开源python库,可以实现数据加载,清洗,转换,统计处理,可视化等功能。而DataFrame和Series是pandas最基本的两种数据结构。DataFrame用来处理结构化数据,Series用来处理单列数据,也可以把DataFrame看作Series对象组成的字典或集合。