自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Learn_ZhangK的博客

积淀,薄发;分享,进步。

  • 博客(8)
  • 资源 (12)
  • 收藏
  • 关注

翻译 摘录机器学习的基本知识以及学习路线

每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。另外,Scikit-learn 也提供了一幅清晰的路线图给大家选择:其实机器学习的基本算法都很简单,下面我们就利用二

2017-11-24 09:35:20 402

翻译 机器学习面试系列七

151.在下面哪种情况下,一阶梯度下降不一定正确工作(可能会卡住)?  答案:(B)  这是鞍点(Saddle Point)的梯度下降的经典例子。另,本题来源于:https://www.analyticsvidhya.com/blog/2017/01/must-know-questions-deep-learning/。152.下图显示了训练过的3层卷积

2017-11-20 14:16:10 2428

翻译 机器学习面试系列六

101.深度学习(CNN RNN Attention)解决大规模文本分类问题  https://zhuanlan.zhihu.com/p/25928551102.如何解决RNN梯度爆炸和弥散的问题的?  本题解析来源:http://blog.csdn.net/han_xiaoyang/article/details/51932536  为了解决梯

2017-11-20 14:12:32 782

翻译 机器学习面试系列五

81.Nave Bayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是:(C)   A.各类别的先验概率P(C)是相等的  B.以0为均值,sqr(2)/2为标准差的正态分布  C.特征变量X的各个维度是类别条件独立随机变量  D.P(X|C)是高斯分布  @BlackEyes_SGC:朴素贝叶斯的条件就是每个变量相互独立。82.

2017-11-20 14:09:32 1283

翻译 机器学习面试系列四

61.说说梯度下降法  @LeftNotEasy,本题解析来源:http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_learning_1_regression_and_gradient_descent.html  下面是一个典型的机器学习的过程,首先给出一个输入数据,我们的算法会通过一

2017-11-20 14:07:20 1987

翻译 机器学习面试系列三

41.线性分类器与非线性分类器的区别以及优劣  如果模型是参数的线性函数,并且存在线性分类面,那么就是线性分类器,否则不是。  常见的线性分类器有:LR,贝叶斯分类,单层感知机、线性回归  常见的非线性分类器:决策树、RF、GBDT、多层感知机  SVM两种都有(看线性核还是高斯核)  线性分类器速度快、编程方便,但是可能拟合效果不会很好  非线性分类器编程复杂,但是效果拟

2017-11-20 13:52:40 747

翻译 机器学习面试系列二

21.请大致对比下plsa和LDA的区别  pLSA中,主题分布和词分布确定后,以一定的概率(、)分别选取具体的主题和词项,生成好文档。而后根据生成好的文档反推其主题分布、词分布时,最终用EM算法(极大似然估计思想)求解出了两个未知但固定的参数的值:(由转换而来)和(由转换而来)。  文档d产生主题z的概率,主题z产生单词w的概率都是两个固定的值。  举个文档d产生主题z的

2017-11-20 13:51:05 1074

翻译 机器学习面试系列一

1.请简要介绍下SVM  SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开。  扩展:这里有篇文章详尽介绍了SVM的原理、推导,http://blog.csdn.net/v_july_v/article/details/7624837。  此外,这里有个视频

2017-11-20 13:48:48 603

apache-hive-2.2.0-src.tar

自己学习udf等源码的时候找的资源,比较新,很实用,感兴趣的可以看看收获很大!

2019-07-30

watermark kafka案例

kafka的多分区watermark机制,这个是在工作中使用的kafka的watermark机制,调试代码,感兴趣可以一观。

2019-03-08

Mac 版本的反编译Java工具

Mac 版本的反编译Java工具,自己用得好的工具。是个值得分享的东东。

2018-10-18

大数据项目爬虫项目demo

此demo是开发组长提供给爬虫组的参考demo,功能齐全,适合研究或者拓展

2018-06-14

某航内部oa使用的新闻爬虫源码

实际工作中真实使用,某航开发的内部人员使用的平台的数据爬虫功能脱胎于此demo,仅供参考

2018-06-14

win下的查找替换神器

个人感觉最好用的一款文件查找替换工具,体积小功能却很强大,胜于其它多数软件,软件完全免费、无广告!只要拥有它,再也不用一个个操作,软件使用也很方便,不必担心出错。

2018-05-10

spark-2.0.2-bin-hadoop2.6

最常用的包,Hadoop和spark学习,实践必备。Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。

2018-05-10

JAVA自带的方法生成唯一ID

java中有自带的方法可以自动帮助我们实现id的获取,可以作为稳定的工具类。可自定义。

2018-01-23

poi方式导出excel(分多个sheet导出)

1).每个sheet中有数据50000条记录,如果sheet中的记录数>50000,则新建sheet且导入数据,并且每个sheet都从第一行开始 2).将数据库中的数据导入excel(2003版.xls)中3).前后台代码都有哦

2016-12-21

基于SSM省市联动源码(ajax_json_jquery)

基于SSM省市联动源码(ajax_json_jquery),sql文件在下载包中包含,内有注意事项。

2016-12-14

基于java和jsp的省市联动的源码(ProCityAreas+mysql)

基于java和jsp的省市联动的源码(ProCityAreas+mysql),mysql的数据文件在文件包含,并包含有注意事项。

2016-12-14

基于php和Ajax省市县三级联动代码(jquery+php+mysql)

基于php和Ajax省市县三级联动代码(jquery+php+mysql),mysql的数据文件在文件中包含。

2016-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除