![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 61
Min_1016
这个作者很懒,什么都没留下…
展开
-
主动学习 Active Learning-2
1. 导入20 新闻组数据集 为了更快操作,我们只对4个分类进行研究 >>> categories = ['alt.atheism', 'soc.religion.christian', ... 'comp.graphics', 'sci.med'] 我们导入文件的列表去匹配这些分类(随机打乱) >>> from sklearn.datasets i原创 2016-09-01 10:29:13 · 855 阅读 · 0 评论 -
主动学习 active learning-1
1. 主动学习也叫做询问学习或最佳实验设计,它是机器学的分支,更人工智能。主要的假设是是否学习算法是可以去选择先要学习的数据。主动学习系统试图跨越标签瓶颈通过学问没有标签的例子去被人类注释者来标签。主动学习目的诗提高朱雀都通过尽量少的标签,因此减少获得标签数据的话费。 2. pool-based 过程:学习者先从少量训练集里标签的例子开始,从精心挑选的例子里获得标签进行学习,然后扩展新知识去选择原创 2016-09-01 08:01:31 · 7171 阅读 · 1 评论 -
机器学习 scikit-learn(2)
标签传播(label Propagation) 强调一种主动学习工具去学习手写数字。开始训练一个只有10个标签的标签传播模型,然后我们选择5个最不确定的去标记。之后我们训练15个标签点。重复4次,最后得到一个拥有30个标签的例子。例子来自于scikit-learn官网 print(__doc__) # Authors: Clay Woolam # Licence: BSD impor原创 2016-08-31 15:53:55 · 625 阅读 · 0 评论 -
机器学习 scikit-learn(1)
1. 通过样本来预测未知的数据;通过学习数据集的特征(训练集 training set)来应用到新的数据上。 2. 监督学习: 分类:样本属于多于两个类,我们想要从已经标记过的数据来预测未标记数据的类---digits 回归:如果想要的输出包括多余一个连续的变量 无监督: 训练集包括一系列的矢量X而没有相对应的y(目标值)。 3. 学习和预测 在数字集中,任务是预测给出图片。原创 2016-08-31 14:53:16 · 416 阅读 · 0 评论