- 博客(5)
- 收藏
- 关注
原创 k-近邻(应用sklearn的莺尾花数据集)
kNN 的作用机制为 在目标周围选取最近k个点,这k个点哪种占比最大,就可以把这个目标分类到那个分类,即有分到相似属性多的类别。该算法和回归,决策树不同之处是,回归和决策树是通过训练集确定参数,参数一旦确定直接就能拿来进行测试,而kNN不同,它的分类要凭借训练数据,或者说并没有训练这一过程。#导入包import pandas as pdimport numpy as npfro...
2019-05-27 10:46:35
800
转载 matplotlib 画图
plt.plot(x,y,alpha=0.5,color='red')plt.xticks(rotation=90)plt.title('2018.4--2019.12')plt.grid(True)plt.legend('Number')from pandas import Series,DataFrameimport matplotlib.pyplot as pltim...
2018-10-15 15:54:59
563
转载 pandas.read_csv参数整理
读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath or any object wi...
2018-10-09 12:44:39
193
转载 OneHotEncoder独热编码和 LabelEncoder标签编码
OneHotEn学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。首先了解机器学习中的特征类别:连续型特征和离散型特征 拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用logistic回归,w1*...
2018-07-12 13:00:55
204
原创 分析Airbnb新用户订房地点
首先先导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport sklearn as skimport datetimeimport osimport seaborn as sns-------------------------------------------------------...
2018-07-12 12:17:33
633
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人