机学库之sklearn
文章平均质量分 83
机学库之sklearn
WoLykos
这个作者很懒,什么都没留下…
展开
-
Python 数据分析基础小结
一、数据读取1、读写数据库数据读取函数:pandas.read_sql_table(table_name, con, schema=None, index_col=None, coerce_float=True, columns=None) pandas.read_sql_query(sql, con, index_col=None, coerce_float=True) pand...原创 2018-09-04 10:22:00 · 566 阅读 · 0 评论 -
分类模型构建
分类模型构建 分类是指构造一个分类模型,输入样本的特征值,输出对应的类别,将每个样本映射到预先定义好的类别中。分类模型若建立在已有类标记的数据集上,则属于有监督学习。在实际应用场景中,分类算法被用于行为分析,物品识别,图像检测等。模块 函数 算法名称 linear_model LogisticRegression 逻辑斯蒂回归 svm SVC ...原创 2018-08-31 16:31:00 · 2542 阅读 · 0 评论 -
数据处理——数据变换
1哑变量处理 也叫独热编码,英文:One-hot Encoding。可将任意离散型数据变为0-1数值。import pandas as pddf = pd.DataFrame({'性别':['男','女','男'], '学历':['本科','硕士','本科'], '民族':['汉族','仫佬族','维吾尔族...原创 2018-07-30 20:39:00 · 278 阅读 · 0 评论 -
数据处理——数据集划分
数据集划分一般在日常工作中我们会将数据集拆分为训练集(train_set)和测试集(test_set)训练集:一般用于训练模型,需要尽可能保证训练的数据具有代表性。 测试集:用于测试模型,检测模型的性能(包括了运行时间,模型的效果等)trian_test_split(*arrays,train_size,test_size,ramdom_state)*arrays:表示需要进行划...原创 2018-08-31 09:57:00 · 653 阅读 · 0 评论 -
sklearn——数据集调用及应用
忙了许久,总算是又想起这边还没写完呢。 那今天就写写sklearn库的一部分简单内容吧,包括数据集调用,聚类,轮廓系数等等。自带数据集API数据集函数 中文翻译 任务类型 数据规模 load_boston Boston房屋价格 回归 506*13 fetch_california_housing 加州住房 回归 2064...原创 2018-08-31 10:45:00 · 1103 阅读 · 0 评论 -
回归模型构建
回归模型构建模块 函数 算法名称 简称 linear_model LinearRegression 线性回归 LR svm SVR 支持向量机回归 SVM neighbors KNeighborsRegressor 最近邻回归 KNN tree DecisionTreeRegressor 回归决...原创 2018-08-31 14:57:00 · 489 阅读 · 0 评论