机器学习
文章平均质量分 64
BUPT_WX
这个作者很懒,什么都没留下…
展开
-
机器学习算法笔记1_2:分类和逻辑回归(Classification and Logistic regression)
形式: 采用sigmoid函数:g(z)=11+e−zg(z)=\frac{1}{1+e^{-z}} 其导数为g′(z)=(1−g(z))g(z)g^\prime(z)=(1-g(z))g(z) 假设: 即: 若有m个样本,则似然函数形式是: 对数形式: 采用梯度上升法求其最大值 求导: 更新规则为: 可以发现,则个规则形式上和LMS更新规则是一样翻译 2016-04-21 14:04:23 · 4793 阅读 · 0 评论 -
机器学习算法笔记2_1:生成学习算法(Generative Learning algorithms)
我们之前学习的算法都是基于p(y|x;θ)p(y|x;\theta), 他的思想是找出找出一个决策边界来将两类分开,而生成算法是先对两个类别分别建模,为了将样本分开,将样本代入两个模型,看样本与哪个类别更匹配。 这种试图直接从输入xx映射到类别标签{0,1}的算法被称为判别学习算法;而通过计算p(x|y)(和p(y))来得到模型的算法被称为生成学习算法 通过贝叶斯函数得到p(y|x)=p翻译 2016-04-21 14:01:07 · 5364 阅读 · 0 评论 -
机器学习笔记1_3:广义线性模型(GLM, Generalized Linear Models)
形式: η\eta称为自然参数(natural parameter), T(y)是充分统计量(通常T(y)=y),a(η)a(\eta)称为log partition function,上式中e−a(η)e^{-a(\eta)}作为归一化参数。通过改变η\eta可以得到不同的分布 伯努利分布(对应逻辑回归): 上式中η=log(ϕ1−ϕ)\eta=log(\frac{\phi}{1-\翻译 2016-04-21 14:05:29 · 2003 阅读 · 0 评论 -
配置Hadoop
安装jdk从甲骨文官网下载对应系统的jdk安装文件将jdk移动到/usr/local/java目录下mkdir /etc/local/java mv ./jdk-8u77-linux-x64.tar.gz /usr/local/java/ cd /usr/local/java解压 tar xvf ./jdk-8u77-linux-x64.tar.gz修改环境变量 vi /etc/原创 2016-04-21 14:09:35 · 690 阅读 · 0 评论 -
HIVE:1_简介
什么是HIVEHive 是一个基于 Hadoop 文件系统之上的数据仓库架构。它为数据仓库的管理提供了许多功能:数据 ETL (抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。同时 Hive 还定义了类 SQL的语言 – Hive QL. Hive QL 允许用户进行和 SQL 相似的操作,它可以将结构化的数据文件映射为一张数据库表,并提供简单的 SQL 查询功能。还允许开发人员方原创 2016-06-03 20:02:58 · 601 阅读 · 0 评论 -
A Two-Stage Ensemble of Diverse Models for Advertisement Ranking in KDD Cup 2012
KDD Cup 2012: 是一个关于搜索广告的竞赛,这个竞赛的任务是通过搜索引擎的历史日志预测某条广告的点击率每一条记录可以看成(#click, #impression, Dis- playURL, AdID, AdvertiserID, Depth, Position, QueryID, KeywordID, TitleID, DescriptionID, UserID)组成的向量,同时,还提原创 2016-06-03 20:27:54 · 1411 阅读 · 0 评论 -
CS231n assignment1 multi svm -- 矩阵乘法的几何意义
问题引入在cs231n的assignment1多类svm部分中,需要采用完全向量法求解损失函数对权重的梯度原创 2016-10-08 23:36:48 · 3566 阅读 · 0 评论