![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
大大kc
今日事,今日毕
展开
-
[机器学习篇]基于Scikit learn库中KNN,SVM算法的笔迹识别
前言 这里介绍,如何运用Scikit learn库中的KNN,SVM算法进行笔迹识别。数据说明: 数据共有785列,第一列为label,剩下的784列数据存储的是灰度图像(0~255)的像素值 28*28=784安装scikit learn库 看了很多安装教程,都没有安装成功。最后参考了官方网站的安装文档,只需要一步步照着做下来就能成功安装scikit learn 安装文档函数介绍转载 2017-03-02 13:53:30 · 880 阅读 · 1 评论 -
最大似然估计(MLE)最大后验概率估计(MAP)以及贝叶斯公式的理解
转自: http://blog.csdn.net/u011508640/article/details/72815981最大似然估计(Maximum likelihood estimation, 简称MLE)和最大后验概率估计(Maximum a posteriori estimation, 简称MAP)是很常用的两种参数估计方法,如果不理解这两种方法的思路,很容易弄混...转载 2018-03-05 16:50:11 · 416 阅读 · 0 评论 -
极大似然估计
转自:http://blog.csdn.net/zengxiantao1994/article/details/72787849极大似然估计 以前多次接触过极大似然估计,但一直都不太明白到底什么原理,最近在看贝叶斯分类,对极大似然估计有了新的认识,总结如下:贝叶斯决策 首...转载 2018-03-05 16:31:09 · 259 阅读 · 0 评论 -
RF、GBDT、XGBoost整理
转自:http://blog.csdn.net/qq_28031525/article/details/70207918 由于本文是基于面试整理,因此不会过多的关注公式和推导,如果希望详细了解算法内容,敬请期待后文。 RF、GBDT和XGBoost都属于集成学习(Ense...转载 2018-03-04 10:39:18 · 305 阅读 · 0 评论 -
主成分分析(PCA)原理详解
转自:http://blog.csdn.net/zhongkelee/article/details/44064401一、PCA简介1. 相关背景 上完陈恩红老师的《机器学习与知识发现》和季海波老师的《矩阵代数》两门课之后,颇有体会。最近在做主成分分析和奇异值分解方面的项目,所以记录一下心得体会。&nbs...转载 2018-03-02 15:37:43 · 428 阅读 · 0 评论 -
详解sklearn中logloss的计算过程
转自:http://blog.csdn.net/ybdesire/article/details/73695163 问题的引入用sklearn,计算loglosss时,对多类别问题,在用这样的代码进行计算(如下),会报错。其中y_true是真实值,y_pred是预测值y_true = [0,1...转载 2018-03-07 11:51:11 · 2902 阅读 · 1 评论 -
Scikit Learn CountVectorizer 入门实例
转自:http://blog.csdn.net/guotong1988/article/details/51567562from sklearn.feature_extraction.text import CountVectorizertexts=["dog cat fish","dog cat cat","fish bird", 'bird']cv = CountVectorizer转载 2018-02-02 16:46:47 · 514 阅读 · 0 评论 -
词性标注Pos Tagging
转自:http://blog.csdn.net/u014568921/article/details/51791495什么是词性标注,Part-of-speech tagging比如下面一段标注过词性的文字文字,用空格分开后,/前面的是英文单词,后面表示它的词性。[plain] view plain copy print?Confidence/NN in/IN the/DT p转载 2018-01-22 17:16:12 · 981 阅读 · 0 评论 -
tensorflow报错:Shape must be rank 2 but is rank 3 for 'MatMul' (op: 'MatMul')
tensorflow矩阵相乘,秩不同报错在tensorflow中写了这样一句:[python] view plain copy print?y_out = tf.matmul(outputs, W) y_out = tf.matmul(outputs, W)其中,outputs的shape为[16,336,400],W的shape为[400,1]出现以下报错:Shape must be r转载 2017-07-26 20:59:13 · 21803 阅读 · 0 评论 -
机器学习笔记 Boost算法(GDBT,AdaBoost,XGBoost)原理及实践
在上一篇博客里,我们讨论了关于Bagging的内容,其原理是从现有数据中有放回抽取若干个样本构建分类器,重复若干次建立若干个分类器进行投票,今天我们来讨论另一种算法:提升(Boost)。简单地来说,提升就是指每一步我都产生一个弱预测模型,然后加权累加到总模型中,然后每一步弱预测模型生成的的依据都是损失函数的负梯度方向,这样若干步以后就可以达到逼近损失函数局部最小值的目标。下面开始要不说人话了,我转载 2017-05-06 19:13:54 · 4081 阅读 · 0 评论 -
关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。123456789101112131转载 2017-05-05 19:36:54 · 481 阅读 · 0 评论 -
[统计学习方法学习笔记]1.1 统计学习
1.1 统计学习1.统计学习的特点以数据为研究对象,数据驱动以计算机及网络为平台,建立在计算机及网络之上以方法为中心,构建模型以对数据进行预测与分析为目的总之,基于数据构建模型,运用模型对数据进行预测与分析2.统计学习的对象-数据从数据出发,提取数据特征,抽象出数据的模型,对数据进行分析与预测数据来源多样,包括平台上的数字,文字,图像,音视频等等同类数据具有一定的统计规律性,可以用概原创 2017-03-02 13:43:05 · 401 阅读 · 0 评论 -
Word2vec加TextRank算法生成文章摘要
转自:http://blog.csdn.net/qq_22636145/article/details/75099792大数据时代的到来在给人们带来海量数据的便利的同时,也带来了大量的数据冗余和垃圾信息。传统的人工书写文本摘要是文章发布和文章阅读极为重要的一环,读者可以快速阅览摘要判断文章的续读必要性。 然而,人工智能的出现以及现在...转载 2018-03-06 13:56:55 · 1975 阅读 · 0 评论