- 博客(7)
- 资源 (8)
- 问答 (1)
- 收藏
- 关注
转载 ArchSummit 北京 2016之lookalike主题
本文整理自腾讯机器学习高级研究员易玲玲在ArchSummit 北京 2016的演讲。Lookalike是做什么的基本上所有的互联网公司都有其广告投放平台,这是给广告主投放广告的一个页面。广告主可以通过广告提交页面提交自己的广告需求,后台会给广告主圈定一部分潜在用户,这个就是我们称为Lookalike的模块。一般的Lookalike会怎么来做呢?它会有两种做法:第一种就是显性的定位,广告主根据用户的...
2018-04-23 14:55:42 306
转载 【机器学习实战系列】读书笔记之利用PCA简化数据(一)
一,引言 降维是对数据高维度特征的一种预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为了应用非常广泛的数据预处理方法。 降维具有如下一些优点:(1)使得数据集更易使用(2)降低算法的计算开销(3)去除噪声(4)使得结果容易理解 PCA(p...
2018-04-11 16:10:59 247
转载 numpy之python 矩阵(mat)操作
python的numpy库提供矩阵运算的功能,因此我们在需要矩阵运算的时候,需要导入numpy的包。1.numpy的导入和使用from numpy import *;#导入numpy的库函数import numpy as np; #这个方式使用numpy的函数时,需要以np.开头。2.矩阵的创建>>> from numpy import *>>> a1=ar...
2018-04-11 11:33:43 67081 2
原创 【机器学习实战系列】读书笔记之利用SVD简化数据(一)
本文详细说明机器学习实战这本书中的示例:餐厅菜肴推荐引擎的算法5.1 推荐未尝过的菜肴推荐系统的工作过程是:给定一个用户,系统会为此用户返回N个最好的推荐菜。为了实现这一点,则需要做到:寻找用户没有评级的菜肴,即在用户-物品矩阵中的0值;在用户没有评级的所有物品中,对每个物品预计一个可能的评级分数。这就是说,我们认为用户可能对物品的打分(这就是相似度计算的初衷);对这些物品的评分从高到底进行排序,...
2018-04-10 17:12:21 426 1
原创 numpy用法(logical_and, nonzero,arange, reshape)
numpy里面有很多数组矩阵的用法,遇到一个就记一个。1.np.logical_and/or/not (逻辑与/或/非)np.logical_and(逻辑与)Syntaxnp.logical_and(x1, x2, *args, **kwargs)Test>>> np.logical_and(True, False)False>>> np.logical_a...
2018-04-10 16:28:01 10625
原创 excel常用的几个操作
最近用excel处理数据遇到一些小问题,好记性不如烂笔头,总结一下1.excel自动添加序号函数:=row()-n加入当age有很多数据时,如何快速填充呢?把鼠标移到单元格的右下角,会出现“+”号,双击“+”号,就会马上填充。2.excel在某一列前加一个特定的字符例如:有一列数据111222333444(1)如何在这一列前加个5,变为:5111522253335444函数: =“@”&A...
2018-04-09 20:41:10 366
原创 【机器学习实战系列】读书笔记之朴素贝叶斯(一)
本文从以下几个方面来介绍:一、贝叶斯和朴素贝叶斯二、文本分类运用三、文本分类算法思路四、算法实现五、总结======================================================================一、贝叶斯和朴素贝叶斯1.基于贝叶斯的分类 2.朴素贝叶斯法二、文本分类应用文本数据的一个典型特征就是其维度较大,比如一篇文档,会有几千甚至上万个词,...
2018-04-04 15:26:21 331
学术海报Posters templates.zip
2019-10-12
native bayes朴素贝叶斯的python代码实现
2018-04-29
基于用户协同过滤usercf的python代码实现
2018-04-29
如何用python找出有包含关系表的父节点id,并导入数据库,关系参考省市区关系
2017-10-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人