自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 maximun classifer discrepancy

MCD

2021-04-02 16:45:02 124

原创 机器学习分类调参、评估

@[toc] 机器学习分类调参、评估def simu_data(): from sklearn.datasets import load_iris,load_breast_cancer # raw = load_iris() raw = load_breast_cancer() df = pd.DataFrame(raw.data) df.columns = raw.feature_names df['label'] = raw.target ret

2021-03-29 22:31:11 267 4

原创 DIN 网络

DIN

2021-03-27 00:44:26 746

原创 分类算法

分类问题分类逻辑回归决策树贝叶斯SVM分类逻辑回归决策树贝叶斯SVM

2021-03-27 00:42:25 119

原创 NFM 网络

NFMNFM 网络核心NFM 网络结构NFM 网络NFM 网络核心NFM 网络引入特征交互池结构,将特征交互后的信息并到一起,传入到DNN网络中。这样DNN 网络学习起来就容易多了NFM 网络结构NFM 网络结构如图,从图中可以看出模型输入的特征还是稀疏特征,然后经过一个embedding 层将稀疏特征,变为稠密特征,最宠输出特征是由输入特征和embedding vector 相乘得到。后面紧着这是Bi-interaction 成,也就是NFM的核心,其将所有向量进行对应元素两两交叉相乘,然后将所

2021-03-24 22:38:41 344

原创 调参

调参参数类型参数超参调参方法参数类型非水卡,调参没啥内容。如果非要说什么的话,可以调研不同算法的超参都有哪些,各自代表什么含义,大概区间范围是多少,然后使用相应调参工具自动调参就行。要对参数有概念,一开始认为机器学习学的就是这些参数啊,后来才意识到,参数也分为两种,超参和机器学习拟合的参数。参数通过数据,算法自己学习出来的权重等。超参不是通过数据学出来的,是一些先验的设定,需要人工手动选择。调参方法调参的方法有很多GridSearchCV、RandomizedSearchCV、skopt、

2021-03-24 18:16:00 431

原创 Bias-variance trade off

偏差方差分析偏差方差分析正则化测试误差估计偏差方差分析正则化测试误差估计

2021-03-22 21:34:48 280

原创 DeeFM模型

deepFM 前言推荐系统模型提升的方向deepFMFM 网络结构和功能deep 网络结构和功能前言deep FM 可以认为是wide&deep 的升级版本,推荐系统模型提升的方向推荐系统的核心技术是CTR 预估,CTR预估是对每次广告的点击情况做出预测,预测用户是点击还是不点击。主要是使用和CTR相关的因素特征对用户是否点击做出预测。最有效的提升模型的表现是进行特征组合,因此如何有效的进行特征组合,但是用人工进行特征组合,随着特征阶数的升高,复杂度成几何倍数提升,且满足不了实时性的需求。因

2021-03-21 23:20:39 183

原创 wide deep模型

wide deep 模型对于推荐系统来说特征是大量稀疏的类别的特征,和图像不同推荐系统中重要的反而是稀疏的类别特征,数值特征反而没那么重要。稀疏特征意味着单个特征表达能力弱、特征组合爆炸、分布不均匀等。推荐系统还常常存在低频、长尾模式,需要具有好的泛化性,来发现这些。wide deep 模型的结构比较简单,他主要由wide部分的神经网络和deep部分的多层神经网络,输出层综合wide部分和deep部分的输出。其中wide部分主要处理比较稀疏的特征,deep层则输入不是稀疏的或者经过降维的特征,wid

2021-03-18 23:17:58 142

原创 回归模型

回归模型一、一元线性回归二、多元线性回归三、多项式回归广义加模型回归树SVR一、一元线性回归线性回归是以前用latex 整理的笔记,这里不知道怎么将latex 直接转化过来直接上图吧二、多元线性回归三、多项式回归多项式回归基本思想就是增加高阶项,从而增加模型的非线性拟合能力广义加模型回归树回归树,以前看的都是分类树,ID3 树、C4.5树都是分类树,主要是用信息增益和信息增益比进行分割。CART 树是Breiman等人在1984年提出的算法,即可以做分类也可以做回归。做分类使用基尼

2021-03-18 14:48:01 272

原创 Deep crossing

Deepcrossing前言一、embedding 层二、stacking 层三、Multiple Residual Units 层四、Scoring 层前言deep croosing 是第一个用于把深度学习用于推荐系统的网络。模型主要由 embedding层、stacking 层、Multiple Residual Units 层、Scoring 层组成。一、embedding 层该层主要是将高维稀疏的特征进行转化成低维稠密特征。二、stacking 层将embedding层的低维稠密特

2021-03-16 22:10:38 137

原创 机器学习的基本任务

机器学习的主要任务机器学习概述一、有监督学习1.1 回归1.2 分类二、无监督学习机器学习概述机器学习是利用计算机基于数据统计规律构建概率统计模型并运用模型进行预测与分析的一门学学科,机器血包括监督学习、无监督学习、半监督学习、强化学习等1。机器学习的几个最根本假设是:独立同分布假设。也就是样本之间相互独立,并且服从相同的统计分布规律。统计学习的三要素为模型、策略、算法1。一、有监督学习监督学习简单来说就是给定数据特征并人为给数据进行打标签,然后给定损失函数,用特定的算法拟合由 x 到 y 的映

2021-03-15 13:44:47 1044

原创 nlp 案例:bag of words meet bag of props

bag of word meet bag of props第一步收集数据集本案例使用的是kaggle数据集bag of word meet bag of props第二步:清洗数据导入需要的库import pandas as pdimport logginglogging.basicConfig(format='%(asctime)s:%(levelname)s:%(message...

2019-04-08 17:43:12 248

原创 python实现二叉树构建遍历(递归和非递归遍历)

注:本博客参考了牛客网视频解法对二叉树进行广度优先遍历,且进行逐层打印请用递归和非递归的方式分别实现二叉树的先中后序遍历打印广度优先遍历不进行换行def travel(self): queuen = [self.head] while queuen: a = queuen.pop(0) print(a.item) if a...

2019-04-06 22:21:06 485

原创 NLP 自然语言处理一般流程

NLP 一般流程收集数据、准备、检查数据第一步:收集数据注意:labelsRichard:rather than spending a month foguring out an unsurpervised mathine learning problem, just label some data for a week and train a classifier.第二步:清洗数据...

2019-04-06 13:47:23 5714

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除