MachineLearning
相国大人
社交网络,社会计算,机器学习
展开
-
用scikit-learn学习K-Means聚类
转载自:刘建平http://www.cnblogs.com/pinard/p/6169370.html 在K-Means聚类算法原理中,我们对K-Means的原理做了总结,本文我们就来讨论用scikit-learn来学习K-Means聚类。重点讲述如何选择合适的k值。1. K-Means类概述 在scikit-learn中,包括两个K-Means的算法,一转载 2017-02-12 10:08:17 · 12018 阅读 · 0 评论 -
K-Means聚类算法原理
转载自:刘建平:http://www.cnblogs.com/pinard/p/6164214.htmlK-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-M原创 2017-02-12 10:06:46 · 21888 阅读 · 3 评论 -
卷积神经网络CNN理论到实践(1)
作者:相国大人导读卷积在神经网络中使用卷积的原因1 sparse interactions2 parameter sharing3 equivariant representations1. 导读卷积神经网络CNN常用于处理具有栅格拓扑特征的数据。时间序列数据可以看做是在固定时间间隔采样的一维网格数据;图像可以看做是由像素组成的一个二维网格。在实际应用中,具有很好的效果。也是进入深度学习领原创 2017-05-31 13:56:13 · 17737 阅读 · 3 评论 -
关于奇异值以及奇异值分解SVD的思考
前言: SVD作为一个很基本的算法,在很多机器学习算法中都有它的身影,特别是在现在的大数据时代,由于SVD可以实现并行化,因此更是大展身手。SVD的原理不难,只要有基本的线性代数知识就可以理解,实现也很简单因此值得仔细的研究。当然,SVD的缺点是分解出的矩阵解释性往往不强,有点黑盒子的味道,不过这不影响它的使用1,SVD的数学基础1.1为什么要做SVD分解?回顾特征值和特征向量 我们首先回原创 2017-02-13 18:33:09 · 10833 阅读 · 0 评论 -
深入浅出EM算法
概率论基础你没见过的概率1约定2链式法则3贝叶斯定理4独立性5条件独立6随机变量独立性性质61对称62分解63弱联合64收缩65相交琴声不等式坐标上升方坐标下降法EM算法导出1 从最大似然估计MLE说起2 我们遇到了什么问题3 EM算法的导出4 最后一点小尾巴5 EM算法收敛性证明EM算法与高斯混合模型学习网友问题解答推荐资料原创 2017-02-14 13:45:55 · 6269 阅读 · 9 评论 -
推荐系统概述
作者:孙相国 contact:sunxiangguodut@qq.com目录推荐系统概述 http://blog.csdn.net/github_36326955/article/details/70821196原创 2017-09-08 10:12:15 · 659 阅读 · 0 评论 -
training deep learning model
page11-20 page21-30 page31-40 page41-50 page51-60 page61-70原创 2017-10-30 08:43:13 · 847 阅读 · 0 评论 -
论文研读1
论文研读文献24[24] B. Perozzi, R. Al-Rfou, and S. Skiena. DeepWalk: Online learning of social representations. In KDD, 2014. 1.问题的引入文章的初衷,普通 的机器学习方法适合于小规模样本的训练,对于规模巨大的样本集来说,并不意味着性能一定同步上升。考虑到在概率图模型中,我们可以根据网络图原创 2017-05-19 14:14:12 · 2320 阅读 · 0 评论 -
深入浅出LDA(1)
Gamma函数1 Gamma函数2 用Gamma函数来扩充定义3 Gamma函数的由来4 Gamma函数的性质原创 2017-11-01 17:04:11 · 1243 阅读 · 0 评论 -
特征工程概述
特征处理1 特征与标注数据清洗11数据采样12 样本过滤2 无量纲化3离散化与哑编码31 离散化32 哑编码4 缺失值处理5 特征生成以及特征学习特征选择1 概述2一般过程3搜索方法4评价标准41 过滤法42 封装法43 嵌入法特征降维1 概述2 主成分分析PCA3 线性判别分析LDA4局部线性嵌入LLE5拉普拉斯特征映射LE6 随机邻域嵌入SNE7原创 2017-12-07 10:09:14 · 3934 阅读 · 0 评论 -
python 中文文本分类
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。赏金将用于拉萨儿童图书公益募捐手机扫一扫,即可:目标读者:初级入门学生。本文假定,你对python已经有了最基本的掌握。如果你希望能够原创 2017-02-06 11:31:21 · 106108 阅读 · 205 评论 -
train_test_split,GridSearchCV,cross_val_score
一:交叉验证 交叉验证示意图:将数据分为训练数据、验证数据和测试数据。 训练数据和验证数据用于做交叉验证和调节参数。测试数据用于求指标。从第一步到第二步,再从第二步到第三步。都可以使用这个函数。 sklearn.model_selection.train_test_split(*arrays, **options) train_data:所要划分的样本特征集 train_target:所要原创 2017-03-02 08:56:06 · 2871 阅读 · 0 评论 -
感知机实现Python
《统计学习方法》第二章python实现:1 感知机原型的python实现1.1 损失函数:L(ω,b)=−∑xi∈Myi(ω⋅xi+b)L \left( \omega ,b \right)=- \sum_{x_i \in M}y_i\left( \omega \cdot x_i +b\right) 其中MM为误分类点的集合。1.2 原始学习算法——非对偶例2.1(采用随机梯度下降)#!/usr/原创 2017-03-04 09:13:48 · 835 阅读 · 0 评论 -
logistic回归
主要内容: 深入浅出Logistic回归 一些实验和实战1,logistic“回归”本节主要内容为:线性判别模型与感知机,广义线性模型,训练算法,python实现。 下面这个是一个感知机的示意图,也可以看成是一个分类器示意图。 图1.1 SUM模块将输入数据按照各个维度进行加权求和,得到的结果送入ff模块。 SUM模块可以写成:y=ωTx+by=\omega^Tx+b,为了后面的处理更加原创 2017-03-05 08:43:57 · 842 阅读 · 0 评论 -
推荐系统概述1
博主用一个多月时间做的关于推荐系统的概述(PPT)。 写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 手机扫一扫,即可: 后面的章节,请阅读《推荐系统概述2》如果这篇博文对你有帮助,希望您可以打赏给博主相国大原创 2017-04-26 19:23:45 · 1940 阅读 · 2 评论 -
推荐系统概述2
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 赏金将用于拉萨儿童图书公益募捐 手机扫一扫,即可: 附:《春天里,我们的拉萨儿童图书馆,需要大家的帮助》 本节主要内容为:凸共轭函数布雷格曼散度矩阵分解原创 2017-05-08 09:39:42 · 1063 阅读 · 1 评论 -
推荐系统概述3
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 赏金将用于拉萨儿童图书公益募捐 手机扫一扫,即可: 附:《春天里,我们的拉萨儿童图书馆,需要大家的帮助》本节主要内容:参考文献文献依赖关系PathSim2原创 2017-05-08 13:09:54 · 907 阅读 · 2 评论 -
推荐系统概述4
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 赏金将用于拉萨儿童图书公益募捐 手机扫一扫,即可: 附:《春天里,我们的拉萨儿童图书馆,需要大家的帮助》本节主要内容:参考文献文献依赖关系基于语义的大众化原创 2017-05-08 13:28:48 · 1728 阅读 · 1 评论 -
推荐系统概述5
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 赏金将用于拉萨儿童图书公益募捐 手机扫一扫,即可: 附:《春天里,我们的拉萨儿童图书馆,需要大家的帮助》本节主要内容:参考文献基于圈的在线社交推荐1 本文原创 2017-05-08 13:50:42 · 1069 阅读 · 0 评论 -
推荐系统概述7
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 赏金将用于拉萨儿童图书公益募捐 手机扫一扫,即可: 附:《春天里,我们的拉萨儿童图书馆,需要大家的帮助》截止目前,推荐系统概述系列全部完毕,这一节,主要列出引用原创 2017-05-08 14:06:18 · 2886 阅读 · 1 评论 -
推荐系统概述6
写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。 赏金将用于拉萨儿童图书公益募捐 手机扫一扫,即可: 附:《春天里,我们的拉萨儿童图书馆,需要大家的帮助》本节主要内容:参考文献基于社会信任混合推荐问题的引原创 2017-05-08 13:59:42 · 997 阅读 · 0 评论 -
softmax回归及其实现(TensorFlow)
在之前的博文《logistic回归》中,我们简单的提到了softmax回归。本文将首先介绍softmax回归的基本原理。然后比较softmax回归于logistic回归的关联。最后用开源TensorFlow编写算法并应用于手写数字(MNIST)的识别。softmax原理softmax与logistic用TensorFlow实现softmax regression识别手写数字#!/usr/bin/en原创 2017-03-29 16:17:46 · 1187 阅读 · 0 评论 -
kNN原理与实现
本节首先介绍KNN的基本原理,包括距离公式,kd树等。然后对kNN进行python实现。接着我们阅读分析sklearn中的knn源码。比较自己的代码和人家的差距。最后用成熟的KNN代码做一些实验。从我们的玩具代码的实验来看,影响knn精度的因素主要有两个 1. k值的选取。一般来讲k值越大,则模型越简单,泛化能力越好,但容易欠拟合;k值越小,模型越复杂,拟合效果好,但是泛化能力不够。一般的,我们可原创 2017-03-28 17:28:59 · 10102 阅读 · 3 评论 -
【机器学习系列博客】1. 维度的诅咒
PreliminariesAuthor: Xiangguo SunWebsite: https://xiangguosun.strikingly.comIn this chapter, I will introduce some basic knowledge before you start your machine learning journey. The followings ...原创 2018-09-10 08:58:20 · 4092 阅读 · 5 评论