渣渣

一个IT愤青的自我告白

论文精读-DeepFM

转载一篇博客文章 https://blog.csdn.net/zynash2/article/details/79348540 DNN部分的详细推导见: https://blog.csdn.net/zynash2/article/details/79360195

2019-06-02 10:49:36

阅读数 20

评论数 0

go的一些基本知识

go 编译,依赖 GOPATH 找到srchttps://blog.csdn.net/u012210379/article/details/50443636 go logginghttp://www.yeolar.com/note/2014/12/20/glog/ -log_dir=”./log...

2019-04-17 13:54:57

阅读数 19

评论数 0

python连接mysql数据库实例

利用python去连接mysql数据库,通引入mysqldb这个第三方库去连接即可。可以写一个DB class,里面涵盖要连接的主机、用户名、密码、数据库name、端口号等信息。 import MySQLdb import sys reload(sys) sys.setdefaultencod...

2019-03-05 10:04:07

阅读数 182

评论数 0

CTR中的特征哈希

在CTR预估中,一种做法是采用人工来做feature engineering,将一些非线性的feature转换为线性的feature,然后喂给LR之类的线性model来做在线学习,在这个过程中,对于一些categorical feature,比如user_id,advertisement_id,直...

2019-01-20 20:42:09

阅读数 310

评论数 0

梯度下降之MiniBatch与并行化方法

问题的引入: 考虑一个典型的有监督机器学习问题,给定m个训练样本S={x(i),y(i)},通过经验风险最小化来得到一组权值w,则现在对于整个训练集待优化目标函数为: 其中为单个训练样本(x(i),y(i))的损失函数,单个样本的损失表示如下: 引入L2正则,即在损失函数中引入,那么...

2019-01-20 20:13:06

阅读数 300

评论数 1

AUC计算方法总结

在机器学习的分类问题中,尤其是二分类问题中,常常需要有评判标准,那么在这些评判标准中,最常用的就是准确率、召回率、ROC和AUC。 其中,在实际使用中,我们往往使用AUC作为评判标准,那么如何计算AUC就是非常重要的。在常见的方法中,最常用的就是通过计算ROC,然后计算ROC下与X轴围成的面积作...

2019-01-20 20:04:47

阅读数 346

评论数 0

FM算法研究及python代码实现

1. 什么是FM? FM即Factor Machine,因子分解机。 2. 为什么需要FM? 1、特征组合是许多机器学习建模过程中遇到的问题,如果对特征直接建模,很有可能会忽略掉特征与特征之间的关联信息,因此,可以通过构建新的交叉特征这一特征组合方式提高模型的效果。 2、高维的稀疏矩阵是实...

2019-01-16 11:45:15

阅读数 233

评论数 0

【机器学习】LR的分布式(并行化)实现——理论篇

逻辑回归(Logistic Regression,简称LR)是机器学习中十分常用的一种分类算法,在互联网领域得到了广泛的应用,无论是在广告系统中进行CTR预估,推荐系统中的预估转换率,反垃圾系统中的识别垃圾内容……都可以看到它的身影。LR以其简单的原理和应用的普适性受到了广大应用者的青睐。实际情况...

2019-01-06 09:35:23

阅读数 377

评论数 0

Feed流简介

LZ可能要去新的公司从事Feed流推荐相关的工作,在此之前,打算先对这一块内容做一个简单的介绍,也有利于我自身后续在这一方面的深耕。 在互联网领域,尤其现在的移动互联网时代,Feed流产品是非常常见的,比如我们每天都会用到的朋友圈,微博,就是一种非常典型的Feed流产品,还有图片分享网站Pint...

2018-12-16 14:27:56

阅读数 991

评论数 0

寻找给定的一个数组中第k大的一个数,或者是寻找前k大个数

这道题是一道常见的面试题,其实这道题可以用快速排序的思想来实现,而且求前k大个数和第k大的数,其实思路是一样的,都是用快排的思想。只要不停遍历,直到找到分界点,即该分界点的右边的数都比该分界点大;该分界点左边的数都比该分界点小。而且刚好该分界点即为第k大的数。 public stati...

2018-11-17 16:17:37

阅读数 471

评论数 0

为什么svm算法在求解过程中,需要将原始问题转化为对偶问题?

对偶问题将原始问题中的约束转为了对偶问题中的等式约束 方便核函数的引入 改变了问题的复杂度。由求特征向量w转化为求比例系数a,在原始问题下,求解的复杂度与样本的维度有关,即w的维度。在对偶问题下,只与样本数量有关。 求解更高效,因为只用求解比例系数a,而比例系数a只有支持向量才为非0,其他全...

2018-11-11 21:56:53

阅读数 1054

评论数 1

二叉树的先序遍历(递归和非递归)、中序遍历(递归和非递归)、后序遍历(非递归)及层次遍历java实现

二叉树的先序遍历,递归实现: public List<Integer> preorderTraversal(TreeNode root) { //用栈来实现 List<Integer&...

2018-11-11 17:16:07

阅读数 304

评论数 0

LeetCode Find and Replace Pattern 查找和替换模式

You have a list of words and a pattern, and you want to know which words in words matches the pattern. A word matches the pattern if there exists a ...

2018-10-17 22:44:32

阅读数 136

评论数 0

LeetCode Repeated String Match 重复叠加字符串匹配

Given two strings A and B, find the minimum number of times A has to be repeated such that B is a substring of it. If no such solution, return -1. F...

2018-10-16 23:21:30

阅读数 104

评论数 0

《机器学习实战》二分-kMeans算法(二分K均值聚类)

首先二分-K均值是为了解决k-均值的用户自定义输入簇值k所延伸出来的自己判断k数目,其基本思路是: 为了得到k个簇,将所有点的集合分裂成两个簇,从这些簇中选取一个继续分裂,如此下去,直到产生k个簇。 伪代码: 初始化簇表,使之包含由所有的点组成的簇。 repeat    从簇表中取出一个簇...

2018-10-16 21:49:28

阅读数 749

评论数 0

CART回归树算法过程

CART决策树算法是一种分类及回归树算法,既可以用于分类,也可以用于回归。但是在李航老师的《统计学习方法》一书中,并没有详细介绍回归树,更多的是介绍分类树,所以有必要对CART回归树进行简单介绍,有利于对CART树用于回归的操作,因为后续GBDT算法也是在CART回归树的基础上进行的,所以深入理解...

2018-10-15 12:27:52

阅读数 622

评论数 0

线性判别分析LDA原理总结

 在主成分分析(PCA)原理总结中,我们对降维算法PCA做了总结。这里我们就对另外一种经典的降维方法线性判别分析(Linear Discriminant Analysis, 以下简称LDA)做一个总结。LDA在模式识别领域(比如人脸识别,舰艇识别等图形图像识别领域)中有非常广泛的应用,因此我们有必...

2018-10-14 16:50:32

阅读数 65

评论数 0

LeetCode String Compression 字符串压缩

Given an array of characters, compress it in-place. The length after compression must always be smaller than or equal to the original array. Every ...

2018-10-13 08:56:15

阅读数 47

评论数 0

Anagram 字母易位词

两个单词如果包含有相同的字母,只是次序不同,则称这两个词为字母易位词,例如:"silent"和"listen".而"apple"和"aplee"就不是字母...

2018-10-10 17:06:14

阅读数 138

评论数 0

【机器学习】k-fold cross validation(k-折叠交叉验证)

交叉验证的目的:在实际训练中,模型通常对训练数据好,但是对训练数据之外的数据拟合程度差。用于评价模型的泛化能力,从而进行模型选择。 交叉验证的基本思想:把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set o...

2018-10-09 22:50:34

阅读数 523

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭