自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BITDDD小栈

推荐算法工程师,日常使用 Spark、Flink、Python 以及其他大数据相关

  • 博客(6)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 Logistic回归-数学原理(1)机器学习实战

前言 :这篇主要讲logistic回归,虽然名字上是回归,但很多时候我们都将他用于分类,由于这一章公式比较多,而且第一次遇到了最优化算法,所以本文大部分会放在相关数学公式的证明和理解上,代码实现部分之后再补充。 先解释一下什么是回归,我们经常会接触到一些数据点,希望拟合一条直线或者曲线去近似他,从而预测其他未知变量的值,而这个拟合过程就称作回归。而logistic回归解决分类问题的主......

2018-03-30 11:59:56 1812 9

原创 朴素贝叶斯-分类及Sklearn库实现(2)机器学习实战

上一篇文章我们简单介绍了朴素贝叶斯的前提条件以及实现过程,并介绍了几个流行的朴素贝叶斯分类法,实现了最基本的文本分类,这篇文章将继续介绍朴素贝叶斯分类,这次主要通过垃圾邮件过滤的程序实现,深化贝叶斯分类的过程,并通过sklearn库实现上文中三种朴素分类器的效果,并比较几种朴素贝叶斯分类算法的准确性。 对于垃圾邮件过滤而言,我们首先要对邮件数据进行一定的处理,才能供算法使用,第一步是......

2018-03-28 15:12:56 1693 3

原创 朴素贝叶斯-分类及Sklearn库实现(1)机器学习实战

KNN,决策树两种算法都明确给出了“该数据实例到底属于哪一类”这类明确的回答,而这一篇讲到的朴素贝叶斯分类器,基于概率论的分类方法,将给出数据实例属于不同种类的概率(基于数据的后验概率),从而供我们选择一个最优的类别猜测结果。例如给定一组数据(x,y),可能的分类是C1,C2,这里我们基于之前给出的数据,求P(C1|x,y)和P(C2|x,y),比较两个概率的大小,判断(x,y)更可......

2018-03-26 21:30:14 4375

原创 决策树-原理与Sklearn库实现(2)机器学习实战

    上篇文章对决策树的基本实现过程进行了了解,关键是几种不同的特征划分方式,sklearn的特点就是代码简单,编码比较简洁,而且使用起来很方便,在基本了解决策树的实现过程后,接下来我们用时下比较流行的Sklearn库实现决策树的建模与绘制。首先看一下sklearn的决策树建模与绘图效果,数据还是上一篇里最基础的判断是否为鱼的数据:from sklearn import treeimport ...

2018-03-23 15:57:57 1389

原创 决策树-原理与Sklearn库实现(1)机器学习实战

    我们经常使用决策树处理分类问题,相比于其他分类算法,决策树算法的实现更加简单明了,而绘制出的决策树也能够轻松的看出数据隐含的内在信息,常用的决策树有CART树,ID3树,还有C4.5树,决策树的优点在于计算复杂度不高,输出结果易于理解,可以处理不相关特征数据,缺点是可能会产生过度匹配问题,因此建模完成后还经常需要剪枝或者在建模时对节点,深度进行一些限制,不过一般数据量不是很大时,这个问题暂...

2018-03-22 15:56:30 831

原创 KNN-原理与Sklearn库实现 机器学习实战

      接触机器学习时间不长,最先接触的就是比较基础的KNN算法和手写数字识别,正好《机器学习实战》这本书第二章又讲到了手写数字识别,就写一些自己的心得体会,同时也要感谢同学的热心帮助。最先接触时,对KNN,Kmeans还不够深入了解,慢慢的才知道,KNN是有监督学习和Kmeans是无监督学习的区别。废话不多说,KNN算法又叫K-近邻算法,其分类思想是测量不同特征值之间的距离从而进行分类。K近...

2018-03-20 20:48:20 763

GraphEMbedding_LINE.pdf

Line 论文

2021-09-13

Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

DSSM论文

2021-06-24

DeepFm分解机论文

DeepFm原版英文论文 deepfm 使用 fm组合低阶特征 再使用DNN组合高阶特征 弥补了Fm在高阶组合特征的缺陷

2020-06-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除