python-机器学习
文章平均质量分 76
学习机器学习基础算法模型
宅神kin
因为同样的坑不想踩两次而写博客
展开
-
机器学习
1. 机器学习原理常见名词 训练数据 类 samples数据样本表 训练集 X_train,y_train 测试集 X_test,y_test 2. 机器学习分类 有监督学习 分类 K近邻、朴素贝叶斯、决策树、SVM 回归 线性回归、逻辑回归、岭回归 无监督学习 聚类 K-means ...原创 2018-06-22 18:51:05 · 514 阅读 · 0 评论 -
人脸补全
人脸补全 需求: 根据人的上半边脸预测下半边脸,用各种算法取得的结果与原图比较 思考: 这是一个回归问题,不是分类问题(人脸数据不固定) 数据集一共包含40个人,每一个人10张照片,分布规律 每一个人取出8张照片作为训练数据,2张照片作为测试数据 样本特征和样本标签如何拆分?上半边脸作为样本特征,下半边脸作为特征标签 效果图...原创 2018-06-25 18:42:07 · 1901 阅读 · 0 评论 -
SVM与K-Means
SVM 理解: 在二维上,找一条最优分割线将两类分开,分割线满足分类两边尽可能有最大间隙 当直线难以完成分类时,引入超平面使数据分类,分类的契机是kerneling内核 应用场景 SVM主要针对小样本数据进行学习,分类和预测(有时也较回归),有很好的泛化能力SVM内核:Linear主要用于线性可分的情形。参数少,速度快,适用于一般数据...原创 2018-06-27 17:47:07 · 6310 阅读 · 0 评论 -
特征工程
思考 机器学习的算法最终预测结果很大程度与特征的筛选,清洗等有很大的关系,如何使特征的选取有章可循? 这就是本文特征工程的重点特征的使用方案 原则上根据业务,尽可能找出对因变量有影响的所有自变量 可用性评估:获取难度、覆盖率、准确率特征处理 特征清洗:包括清洗异常样本、采样(数据不均衡,样本权重) 特征预处理(重点)特征监控 ...原创 2018-06-28 17:45:41 · 382 阅读 · 0 评论