自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

来自Daisy和她的单程车票

正在探索机器学习和深度学习的奥妙。

  • 博客(7)
  • 资源 (23)
  • 收藏
  • 关注

原创 ALS推荐算法简介

目录ALS(交替最小二乘法)1.1 原理推导2.1.1 ALS2.1.2 ALS-L2正则化2.1.3 Stochastic Gradient ALS2.1.4 隐式反馈(Implicit Feedback )2. 优缺点ALS(交替最小二乘法)ALS (Alternating Least Squares) 交替最小二乘法。ALS 的核心是:打分矩阵R是近似低秩的。换句话说,一个打分矩阵 R ...

2020-04-12 22:25:37 2166

原创 tensorflow2.0基础简介

tensorflow2.0简介1、tensorflow 2.0基础知识简介tensorflow2.0是谷歌在2019年3月份发布更新的一款到端开源机器学习平台,其目的在于优化tensorflow1.x版本,使其更灵活和易用性;2.0版本较1.x有较大的更新,具有简易性、更清晰、扩展性三大特征,大大简化1.x 的API,其官方中文文档链接如:https://github.com/geektutu...

2020-04-12 20:56:06 946

原创 数据倾斜原因及其解决方案

1、数据倾斜的概念数据倾斜是在map/reduce执行程序时,reduce大部分节点执行完毕,但有一个或者少数几个节点执行很慢,导致其他程序一直处于等待的状态,使得整个程序执行时间较长。2、为什么出现数据倾斜?主要是在shuffle过程中,由于不同的key对应的数据量不同导致不同task处理的数据量不一样的问题。表现如下:1、大部分的task执行完毕,少数几个甚至一个task可以执行但...

2020-04-12 20:55:14 1436

原创 分类算法评价准则

1 分类算法评价准则分类评价准则有Recall, Precision, ROC,AUC, Lift 曲线,KS曲线等。1.1 基础指标为了描绘的简单,在此给出一个实例:Table 3.1 样例图indexScoretrue labelPredict labelindexScoretrue labelPredict label10.9TT110....

2020-04-12 20:53:46 2342 2

原创 hive sql基本语法及注意事项

sql left join和 not in 比较建议在写sql语句的时候,尽量避免用not in 而 优先选择left join,这样效率会提高很多尽量用count(1) 而不是count(*)

2020-04-01 14:30:38 372

原创 spark DataFrame正则表达式

spark DataFrame正则表达式注意 在spark中使用正则的时候,需要时时刻刻加上转义自符'\'需要使用'\\',例如'\w'需要使用'\\w'正则表达式,使用的库在sql.funtions 下,如导入split和regexp_extractimport org.apache.spark.sql.functions.{regexp_extract,split}1.1 spl...

2020-04-01 14:22:51 3599

原创 python积铢累寸

一、python package1.numbanumba有两种编译模式:nopython模式和object模式。前者能够生成更快的代码,但是有一些限制可能迫使numba退为后者。想要避免退为后者,而且抛出异常,可以传递nopython=True.import numba@jit(nopython=True)def f(x, y): return x + ynumba目标是加快...

2020-04-01 12:12:08 463

sklearn_contrib_lightning-0.4.0-cp35-cp35m-win_amd64.whl

python sklearn_contrib_lightning-0.4.0-cp35-cp35m-win_amd64.whl

2018-03-09

PyQt4-4.11.4-cp35-cp35m-win_amd64.whl

PyQt4-4.11.4-cp35-cp35m-win_amd64.whl,万能的http://www.lfd.uci.edu/~gohlke/pythonlibs/好像不能访问了,贼烦,所以共享一下资源

2018-03-09

最新最全2013信息系统项目管理师历年真题(含上午题、案例分析、论文)试题和答案

最新最全2013信息系统项目管理师历年真题(含上午题、案例分析、论文)试题和答案

2017-11-04

2014信息系统项目管理师历年真题(含上午题、案例分析、论文)试题和答案

最新最全2005-2014信息系统项目管理师历年真题(含上午题、案例分析、论文)试题和答案

2017-11-04

2005信息系统项目管理师历年真题(含上午题、案例分析、论文)试题和答案

2005信息系统项目管理师历年真题(含上午题、案例分析、论文)试题和答案

2017-11-04

网络信息安全试题

网络信息安全试题,带答案,,信息和知识面非常全,,

2017-11-04

武汉理工大学2010年研究生入学考试试题-软件工程

武汉理工大学2010年研究生入学考试试题---软件工程,走过路过不要错过

2017-11-04

武汉理工大学2006年研究生入学考试试题-软件工程

武汉理工大学2006年研究生入学考试试题-软件工程专业,不要错过哦

2017-11-04

武汉理工大学2002年研究生入学考试试题

武汉理工大学2002年研究生入学考试试题-数据结构

2017-11-04

on discriminative vs generative classifiers

从理论和实践区分判别模型和生成模型区分,andrew NG所写

2017-11-04

武汉理工大学计算机科学与技术学院考研资料

详细介绍武汉理工大学计算机类专业的考研各种题型,代码源码,机试题等

2017-11-03

java各种算法,类似于冒泡,汉诺塔,三阶幻方,判断回文

1. 平年,闰年,求今天是星期几 2. 九九乘法表梯形输出 3. 排序冒泡法 4. 求数组中最大的数和最小的数,并输出 5. 当前月的下一个月是上一月是 6. 三阶幻方 7. 判断回文 8. 判断两个字符串中相同位置上相等的字符 两个字符串中相同的字符,不重复 9. 判断数组是否相等 10. 求三角形的面积 11. Smith数 12. 数组左移右移 13. 验证哥德巴赫猜想 14. ABC--- 15. 1+[]+2+[]+3+[]+4+[]+5+[]+6+[]+7+[]+8+[]+9+[]=110 []用+ - 或者为空,如果为空,1空2 变为12 16. 信用卡号码满足,倒数第1、3、5……位的和加上倒数第2、4、6位数字乘以2(如果乘以2后变成两位数,则减9)的和。能被10整除。任意输入一个数字串,检验是不是满足条件。 17. 汉诺塔问题

2017-11-03

A Communication-Efficient Parallel Algorithm for Decision Tree

基于投票的数据并行则进一步优化数据并行中的通信代价,使通信代价变成常数级别。在数据量很大的时候,使用投票并行可以得到非常好的加速效果。更具体的内容可以看NIPS2016的文章[A Communication-Efficient Parallel Algorithm for Decision Tree]。

2017-11-03

lightgbm算法

具体讲解lightgbm算法,直方图加速,预排序思想,等等

2017-11-03

DoKuKIWI安装说明

DoKuKIWI windows 安装说明

2017-07-31

train-images-idx3-ubyte.gz

train-images-idx3-ubyte.gz

2017-05-31

lucene-core-2.4.1.jar je-analysis-1.5.3.jar

这是有关搜索的lucene包,找了好久没找到,觉得对大家应该有用吧~

2016-01-03

贝叶斯概率

这是我在积极总结的学习资料,希望对大家有帮助

2016-01-03

1 CSS基本语法

1 CSS基本语法大家可以学习,这对你们有帮助

2013-12-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除