自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Pseudo-Label:The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks

这是一篇发表在 ICML 2013 的文章,作为半监督神经网络的一篇代表文章。【文章】【代码】文章中采用了pesudo-label的方法来作为无标签样本的伪标签。文章的主要想法是self-training,伪标签的确定也是通过有标记样本训练的神经网络,来对无标记的样本进行预测,选择出只选择对每个未标记的样本具有最大预测概率的类。这个方法为什么会成功,文章中解释到:(1)低密度分离(2)熵要小,这...

2019-10-24 19:37:00 4668

原创 Learning with Pseudo-Ensembles

Learning with Pseudo-EnsemblesPseudo-EnsemblesThe Pseudo-Ensemble Agreement regularizer新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是...

2019-10-23 15:31:54 1047

原创 生成模型

数理统计基本概念 先解释一些基本概念:举例说明,如果你在山洞,觉得山洞中有熊出现的事件为,然后听到山洞中传出来一阵熊吼的事件为。那么一开始你觉得山洞中有熊的事件的概率为,听到熊吼之后的认为山洞中有熊的概率为。很明显。这里就是所谓的先验概率;就是后验概率。先验概率:为先验概率,是根据以往数据的分析或者经验的到的概率; 后验概率:为后验概率,是根据本次实验的信息从而重新修正的概率。 条件概...

2018-11-14 17:32:58 600

原创 Pandas(一)

pandas有三种基本数据结构:(1)Series (2)DataFrame (3)Index(一)pandas的Series对象pandas的Series对象是一个带索引值的一维数组。创建一个数组对象如下:  import pandas as pd   data = pd.Series([1.1,2.789,3.8644,4,5,6]) 输出结果如下0    1.10001    2.78902...

2018-04-10 20:26:10 255

原创 聚类算法(一)

聚类任务  在无监督学习(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。形式化的表示为:样本集D={x1,x2...,xm}D={x1,x2...,xm}D = \left \{x_1,x_2...,x_m \right \} 包含mmm个无标记样本,每个样本xi=(x...

2018-04-07 13:49:56 311

转载 梯度下降算法(二)

梯度下降法大家族(BGD,SGD,MBGD)批量梯度下降法(Batch Gradient Descent) 批量梯度下降法,是梯度下降法最常用的形式,具体做法也就是在更新参数时使用所有的样本来进行更新,这个方法对应于前面3.3.1的线性回归的梯度下降算法,也就是说3.3.1的梯度下降算法就是批量梯度下降法。   θi=θi−α∑j=0m(hθ(x(j)0,x(j)1,...x...

2018-03-29 21:12:10 235

原创 Numpy 学习(一)

numpy ndarraynumpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0) 序号 参数及描述 1. object 任何暴露数组接口方法的对象都会返回一个数组或任何(嵌套)序列。 2. dtype 数组的所需数据类型,可选。 3. copy 可选,默认为true

2018-03-29 20:01:19 166

原创 数据描述(一)

数据描述主要有三部分: 集中趋势的测度 离散程度的测度 分布形态的测度 集中趋势的测度 平均数也叫做集中趋势量数(measures of central tendency),一般有三种形式:均值、中位数和众数。均值(mean):数据组中所有数值的总和除以该组数值的个数。 中位数(median):一系列数据的中点。中位数对极值不敏感,均值对极值...

2018-03-27 17:22:22 1159

原创 梯度下降算法(一)

梯度下降法 梯度下降法是求解无约束最优化问题的一种最常用的方法,有实现简单的特点。梯度下降法是迭代算法,每一步需要求解目标函数的梯度向量。假设f(x)f(x)f(x)是NNN为维几里德空间上具有一阶连续偏导数的函数。符号解释 学习率: aaa 特征值:x1,x2x1,x2x_{1},x_{2} 参数:w1,w2w1,w2w_{1},w_{2} 预测函数:...

2018-03-24 15:50:00 450

转载 损失函数(一)

1. 损失函数损失函数(Loss function)是用来估量你模型的预测值 f(x)f(x) 与真实值 YY 的不一致程度,它是一个非负实值函数,通常用 L(Y,f(x))L(Y,f(x)) 来表示。损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数的重要组成部分。模型的风险结构包括了风险项和正则项,通常如下所示: θ∗=argminθ1N∑i=1NL(yi,f...

2018-03-21 16:12:43 1362

转载 机器学习公开数据集

原文地址:http://rensanning.iteye.com/blog/1601663海量数据(又称大数据)已经成为各大互联网企业面临的最大问题,如何处理海量数据,提供更好的解决方案,是目前相当热门的一个话题。类似MapReduce、 Hadoop等架构的普遍推广,大家都在构建自己的大数据处理,大数据分析平台。 相应之下,目前对于海量数据处理人才的需求也在不断增多,此类人才可谓炙手可热!越

2018-01-31 17:52:46 9068

翻译 mahout (一)kmeans的使用

原文地址:http://mahout.apache.org/users/clustering/k-means-commandline.html

2017-11-27 11:17:11 339

转载 常用机器学习数据集网站

常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/UCI收集的机器学习数据集ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/\\MLRepository.htmstatli

2017-11-26 22:01:16 2423 1

原创 hadoop2.7+mahout0.13.0在数据集synthetic_control.data具体操作

hadoop 2.7运行环境:Ubuntu16.04master节点:1slave节点:2

2017-11-20 19:42:43 1776

转载 损失函数(二)

损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子:θ∗=argminθ1N∑i=1NL(yi,f(xi;θ))+λ Φ(θ)θ∗=a...

2017-09-03 20:52:47 665

转载 无法获得锁 /var/lib/dpkg/lock - open (11: 资源暂时不可用)

sudo apt-getinstall python-pipE: 无法获得锁 /var/lib/dpkg/lock - open (11: 资源暂时不可用)E: 无法锁定管理目录(/var/lib/dpkg/),是否有其他进程正占用它?解决办法:当执行sudo apt-get相关的命令,会显示上面类似的错误参考别人的解决方法是:sudo rm /va

2017-06-25 16:04:34 247

原创 良/恶性乳腺癌肿瘤预测

'''Created on 2017年5月25日@author: Administrator'''#导入numpy工具包,并且更名为npimport numpy as np#导入pandas工具包,并且更名为pdimport pandas as pd#导入matplotlib工具包中的pyplot,并且更名为pltimport matplotlib.pyplot as plt#导入sklearn工

2017-05-25 16:43:24 721 1

翻译 线性模型

线性模型一、基本形式 线性模型是一种有监督学习,它试图得到一个线性模型以尽可能准确地预测实际输出标记。f(x)=w1x1+w2x2+...+wdxd+bf(x)=w_1x_1+w_2x_2+...+w_dx_d+b其中x1x_1到xdx_d为描述事例xx的dd个属性,w=(w1;w2;...;wd),ww=(w_1;w_2;...;w_d),w可以看作每个属性的权重系数越大对于线性模型影响越大。

2017-05-22 19:33:31 585

原创 Matlab数组创建

数组是Matlab进行计算和处理的核心内容之一,处于快速计算的需要,Matlab总是把数组看作存储和运算的基本单元。一、一维数组的创建(1)直接输入法:可以通过逗号,空格来分割数组元素。(2)步长生成法:x=a:inc:b其中a,b为其中一维数组的起始数值和终值数值,inc为间隔的步长。(如果a,b为整数时,省略inc,可以生成步长为1的数组)(3)等间距线生成方法

2017-05-16 17:32:27 2750

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除