![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Anderson29
这个作者很懒,什么都没留下…
展开
-
机器学习认识
机器学习定义对于给定的任务T,在合理的性能度量方案P的前提下,某计算机可以自主的学习任务T的经验E;随着提供合适,优质,大量的经验E,改程序对任务T的性能逐步提高。其中不要对大数据等做细致的区分。 机器学习流程对于给定数据集(输入实例x的特征向量)x=(x(1),x(2),...,x(n))Tx=(x^{(1)},x^{(2)},...,x^{(n)})^T,注意x(i)x^{(i)}表示x的第i原创 2017-05-19 10:30:59 · 223 阅读 · 0 评论 -
学习曲线
机器学习 learning curve学习曲线用去判断模型学习过程中是否存在过拟合,如果在训练集和测试集上差距很大,则存在了过拟合现象import numpy as np import matplotlib.pyplot as plt from sklearn.learning_curve import learning_curve def plot_learning_curve(estimator原创 2017-07-24 11:06:27 · 717 阅读 · 0 评论 -
离群点过滤
outlier 过滤 python实现Tuckey算法实现代码# Outlier detection import numpy as np from collections import Counter def detect_outliers(df,n,features): """ Tuckey算法 """ outlier_indices = [] # ite原创 2017-07-24 10:57:40 · 2061 阅读 · 0 评论 -
回归问题属性的可视化
回归问题预测一般用折线图进行可视化,去了解属性和属性值之间的变化,这里参考《预测分析核心算法》为教程做以整理,对属性值可视化进行描述。数据情况 数据是预测鲍鱼年龄的回归问题。数据column分别为’Sex’(性别), ‘Length’(长度), ‘Diameter’(直径), ‘Height’(高度),’Whole Wt’(整体体重), ‘Shucked Wt’(去壳后重量),’Viscera Wt原创 2017-07-24 16:35:08 · 1475 阅读 · 0 评论