![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
火云明月
计算机知识爱好者,学习计算机专业
展开
-
特征工程学习笔记
Kaggle上有一句非常经典的话,**数据和特征决定了机器学习的上限**,而模型和算法只是逼近这个上限而已特征工程就是通过X,创造新的X’。基本的操作包括,升维、降维。主要有特征处理,特征选择。一.特征处理工具:sklearn库中的preprocessing模块。1.1 标准化sklearn的标准化处理提供了StandardScaler()和MinMaxScaler()两种方法。1.2 二值化二.特征选择工具:sklearn中的feature_selection库2.1当数据预处理完成原创 2020-09-10 15:37:25 · 126 阅读 · 0 评论 -
logit&sigmoid&logistic&logits傻傻分不清
在机器学习、深度学习中经常会遇到logit、sigmoid、logistic、logits几个概念,特别再加上一些汉语翻译的如“逻辑斯蒂”,更加容易混淆,这篇文章就为大家总结区分下。首先要明确logit、sigmoid、logistic、logits都是数学函数的名称,表示一个具体的函数。分别看下, logit(x)=log(x1−x)\ logit(x) = log( \frac{x}{1-x} ) logit(x)=log(1−xx) sigmoid(x)=原创 2020-06-03 23:05:53 · 1868 阅读 · 0 评论 -
分类和聚类的区别
1.分类 在机器学习中,分类是一种有监督的学习,每个训练数据都已经做好标签,打上了标记。 比如预测一个人是否喜欢玩电脑游戏的问题。给出的训练数据的特征值包含年龄,性别,收入等, 并且每条数据都标注上是否喜欢玩电脑游戏。然后使用构建决策树模型的相应算法(ID3,C4.5)训练出分类模型。此过程就是在进行分类。2.聚类 与分类相比较,聚类是一种无监督的学习。将本身没有类别的原创 2017-03-03 19:24:23 · 933 阅读 · 0 评论 -
PCA降维与特征选取的区别
1.概念简介 PCA是指 Principal Components Analysis,译为主要成分分析。用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征。改变了原来特征的形式。 特征选取是从包含多个特征的数据集中挑选出几个特征作为实际使用的数据集,用于训练模型。没有改变特征的形式。2.问题背景 在实际的问题中,数据集中的特征可能过多。比如,30*30的一张图片的特征会有900个原创 2018-02-02 18:59:04 · 6789 阅读 · 0 评论 -
基于Keras的LeNet-5的超参数调节实验
一.使用技术说明 1.Keras是一个神经网络API,用python编写,以Tensorflow、CNTK、Theano开源深度学习库为后端。可以在短时间内上手入门,具备模块化、以扩展等特点。支持卷积网络,能在CPU和GPU上无缝运行。 2.tensorflow是谷歌公司开发的开源深度学习库,与theano、CNTK等深度学习框架相比,star和follow人数最多。使用Keras和tenso原创 2018-02-02 19:18:15 · 2805 阅读 · 1 评论 -
XGBoost导读与实战阅读记录(一)——rabit和allreduce
引言在大致浏览了原文中的最开始的代码发现了几个陌生的、好像和分布式有关的名词——rabit和allreduce。所以这篇文章主要来记录下rabit和allreduce的知识。什么是rabitrabit是一个库,可以提供allreduce和广播的容错接口。rabit是为了支持分布式机器学习而设计。是支持分布式XGBoost的Backbone库。rabit的API文档:https://h...原创 2019-05-26 10:15:38 · 870 阅读 · 0 评论 -
条件随机场学习资料汇总
introductionConditional random fields (CRFs) are a probabilistic framework for labeling and segmenting structured data, such as sequences, trees and lattices.The underlying idea is that of defin...原创 2019-05-26 10:59:50 · 204 阅读 · 0 评论 -
分词资料汇总
CRF++工具分词教程http://www.52nlp.cn/中文分词入门之字标注法4#commentshttps://blog.csdn.net/u010626937/article/details/78414292https://blog.csdn.net/u010626937/article/details/78414292https://blog.csdn.net/j...原创 2019-05-26 11:15:19 · 127 阅读 · 0 评论