- 博客(16)
- 资源 (13)
- 收藏
- 关注
转载 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标
2016-09-20 22:02:52 1898
转载 机器学习基石笔记1——在何时可以使用机器学习(1)
转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html目录机器学习基石笔记1——在何时可以使用机器学习(1)机器学习基石笔记2——在何时可以使用机器学习(2)机器学习基石笔记3——在何时可以使用机器学习(3)(修改版)机器学习基石笔记4——在何时可以使用机器学习(4)机器学习基石笔记5——为什么机器可以学习(1)
2016-09-20 09:24:02 528
原创 最近打算好好整理整理知识,这里列出可参考的博客列表
1.感觉比较清晰大气的 http://www.powerxing.com/logistic-regression-in-python/
2016-09-14 10:29:29 427
转载 Factorization Machines 学习笔记(四)学习算法
Factorization Machines 学习笔记(四)学习算法标签: FMFactorizationMachine稀疏特征SGDALS2014-10-28 10:22 9370人阅读 评论(7) 收藏 举报 分类:数据挖掘(34) 机器学习(36) 版权声明:本文为博主原创文章,未经博主允许不得转载。
2016-09-10 18:51:31 2433
转载 Factorization Machines 学习笔记(三)回归和分类
最近学习了一种叫做 Factorization Machines(简称 FM)的算法,它可对任意的实值向量进行预测。其主要优点包括: 1) 可用于高度稀疏数据场景;2) 具有线性的计算复杂度。本文将对 FM 框架进行简单介绍,并对其训练算法 — 随机梯度下降(SGD)法和交替最小二乘(ALS)法进行详细推导。相关链接:(一)预测任务(二)模型方程(三)回归和分
2016-09-10 18:49:19 1100
转载 Factorization Machines 学习笔记(二)模型方程
最近学习了一种叫做 Factorization Machines(简称 FM)的算法,它可对任意的实值向量进行预测。其主要优点包括: 1) 可用于高度稀疏数据场景;2) 具有线性的计算复杂度。本文将对 FM 框架进行简单介绍,并对其训练算法 — 随机梯度下降(SGD)法和交替最小二乘(ALS)法进行详细推导。相关链接:(一)预测任务(二)模型方程(三)回归和分
2016-09-10 18:48:19 455
转载 Factorization Machines 学习笔记(一)预测任务
最近学习了一种叫做 Factorization Machines(简称 FM)的算法,它可对任意的实值向量进行预测。其主要优点包括: 1) 可用于高度稀疏数据场景;2) 具有线性的计算复杂度。本文将对 FM 框架进行简单介绍,并对其训练算法 — 随机梯度下降(SGD)法和交替最小二乘法(ALS)法进行详细推导。相关链接:(一)预测任务(二)模型方程(三)回归和
2016-09-10 18:47:49 759
转载 简单易学的机器学习算法——因子分解机(Factorization Machine)
一、因子分解机FM的模型 因子分解机(Factorization Machine, FM)是由Steffen Rendle提出的一种基于矩阵分解的机器学习算法。1、因子分解机FM的优势 对于因子分解机FM来说,最大的特点是对于稀疏的数据具有很好的学习能力。现实中稀疏的数据很多,例如作者所举的推荐系统的例子便是一个很直观的具有稀疏特点的例子。2、因子分解机F
2016-09-10 18:11:19 4430
转载 远程访问jupyter notebook
ipython notebook是一个基于浏览器的python数据分析工具,使用起来非常方便,具有极强的交互方式和富文本的展示效果。jupyter是它的升级版,它的安装也非常方便,一般Anaconda安装包中会自带。安装好以后直接输入jupyter notebook便可以在浏览器中使用。但是它默认只能在本地访问,如果想把它安装在服务器上,然后在本地远程访问,则需要进行如下配置:1. 登
2016-09-07 23:19:20 26687 8
转载 NumPy Basics: Arrays and Vectorized Computation
1. NumPy Basics: Arrays and Vectorized ComputationNumPy 是 Numerical Python 的简称,是高性能计算和数据分析的基础包。本书中几乎所有高级工具都是建立在它的基础之上,下面是它所能做的一些事情:ndarray,快速和节省空间的多维数组,提供数组化的算术运算和高级的 广播 功能。使用标准数学函数对整个数组的数据进
2016-09-05 09:44:43 854
转载 线性判别分析(LDA), 主成分分析(PCA)
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言: 第二篇的文章中谈到,和部门老大一宁出去outing的时候,他给了我相当多的机器学习的建议,里面涉及到很多的算法的意义、学习方法等等。一宁上次给
2016-09-02 20:18:54 789
转载 强大的矩阵奇异值分解(SVD)及其应用
机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy前言: 上一次写了关于PCA与LDA的文章
2016-09-02 20:16:59 662
原创 逻辑回归:从入门到精通
这里推荐一个非常经典的逻辑回归教程,这个人可是韩家炜的学生,好好膜拜一下~~~ 文章链接为:http://www.tianyancha.com/research/LR_intro.pdf
2016-09-02 18:54:12 2829
转载 深入FFM原理与实践
深入FFM原理与实践del2z, 大龙 ·2016-03-03 09:00FM和FFM模型是最近几年提出的模型,凭借其在数据量比较大并且特征稀疏的情况下,仍然能够得到优秀的性能和效果的特性,屡次在各大公司举办的CTR预估比赛中获得不错的战绩。美团点评技术团队在搭建DSP的过程中,探索并使用了FM和FFM模型进行CTR和CVR预估,并且取得了不错的效果。本文旨在把我们对FM和FF
2016-09-02 18:44:08 605
转载 click through rate prediction
click through rate prediction包括内容如下图: 使用直接估计法,置信区间置信率的估计:1.使用二项分布直接估计p(0.04p^0.06)=∑0.04n≤k≤0.06n(nk)0.05k0.95n−kp(0.04123456
2016-09-02 18:37:16 818
android 无线打印实现源代码 附带send2Printer
2012-08-21
send2printer可以直接使用,支持第三方开发
2012-08-21
VMware创建共享磁盘(图行-详细)
2012-03-15
Ubuntu_Hadoop部署笔记
2012-02-22
Flex+Lcds+FB3+Java+MyEclipes7.5
2010-11-27
JDK_API(中文最新版).CHM
2010-08-06
matlab函数帮助文档
2010-08-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人