machine learning
文章平均质量分 85
高斯拟合的周萌萌
搬砖。。搬砖
展开
-
机器学习基础之概率浅析,电影分析
本文主要以一个电影统计的数据作为分析的基础数据,进而描述一下 如何用python 进行简单的数据分析统计,得出想要的结果。本文用到的csv中的数据为——电影上映的年份,电影中死亡的人数。首先从github上将数据下载下来:import urllib.requesturllib.request.urlretrieve('https://github.com/sjmgarnie原创 2017-10-01 21:18:01 · 550 阅读 · 0 评论 -
理解梯度下降,随机梯度下降,附电影推荐系统的简单代码小样 1.
白话梯度下降:梯度下降的官方概念网上有很多,说了也没用,反正我刚学的时候是没太看懂。需要的背景知识,偏导率(很重要)两个坐标点的距离,是两个向量的点乘积以实际问题为例,一个电影推荐系统,向量v(v1,v2)代表这个电影本应存在的位置,用户向量u(u1,u2)代表用户存在的位置,现在有实际数据是每个电影的网站评分,和一些用户对某些电影的评分,去评估每个电影应该存在的位置以原创 2017-10-22 22:48:14 · 719 阅读 · 0 评论 -
理解梯度下降,随机梯度下降,附电影推荐系统的简单代码小样 2
这是这一title 的下半部分,主要是因为这个浏览器好像缓存不了那么多东西,所以写到某一个临界点的时候,总是崩溃,要死了我都。最后一部分,老师给了八十万行的数据,让我们自行处理,本来是要按照上面的代码处理一下就好了,我自己写了个三维的图。import pandas as pd#three dimensions, x is item y is rating z is th原创 2017-10-22 23:25:56 · 495 阅读 · 0 评论 -
基于线性回归与核函数——linear function & basis function 的代码,处理马拉松数据
首先,线性规划,比较简单,对误差方程 Ex = (y-mx-c)^2 分别求偏导,再令偏导等于0 一步一步的求出m和c。 令偏导等于0的原因是为了寻找极致点,我们假设每次迭代的都是极值点,而极值点的特点是导数为0。python代码表示就是:for i in np.arange(1000000): m = ((y - c)*x).sum()/(x*x).sum()原创 2017-11-01 01:17:37 · 4936 阅读 · 1 评论 -
深度学习笔记-卷积神经网络CNN与循环神经网络RNN有什么区别?
CNN与RNN本质的不同就是所基于的假设不同,由于核心假设的不同,导致实现方式的差异。CNN首先理解什么叫做卷积,或者说为什么要翻译为卷积神经网络。卷积的定义:https://baike.baidu.com/item/%E5%8D%B7%E7%A7%AF/9411006?fr=aladdin简单来说,卷积就是两个相对运动的几何图形,在相交到相离之间,重叠的面积。对于CNN神原创 2018-02-01 04:38:40 · 35054 阅读 · 0 评论 -
罗辑回归,Logistic Regression(or sigmoid function)
作者:寒小阳 && 龙心尘时间:2015年10月。出处:http://blog.csdn.net/han_xiaoyang/article/details/49123419。声明:版权所有,转载请注明出处,谢谢。这篇文章是我在了解罗辑回归的时候搜到的,我觉得写得特别好。发现发布者是寒小阳。。。。我想起来, 我还买过他的NLP的视频课程,讲的还挺好的,而且声音超级转载 2018-01-25 02:55:15 · 2960 阅读 · 0 评论 -
基于几条大神链接的理解,总结数据降维处理——PCA
PCA的目的就是在数据特别多而且特征散乱的情况下,找到很少的几个差别很大的特征,丢弃其他差别较小的特征(也可以认为是噪声),这样可以将数据简化又不会丢失太多的特征差别。在坐标系中表示, 就是找到一个新的坐标系,让这些数据点在坐标轴伤的投影差距最大,看下图:(字丑多担待。。。)http://blog.csdn.net/zhongkelee/article/details/44原创 2017-12-12 04:49:11 · 2742 阅读 · 1 评论 -
SVM (support vector machine)一个在svm文章中 你可能可以看懂的版本。
鉴于网上所有博客都是上来就贴公式,本人在学习的时候,根本没有办法理解svm到底要干什么,所以有了这篇稍微通俗一点的讲解并且附上本人的学习资料。(u其实就是x)关于第一步的解释: 我们把坐标系中的点都看作是向量(坐标系就是你选取的feature),w 是分界线的垂直向量, 根据图上的公式,我们可以求任何一个点 在决策线的垂直方向上的投影。 根据这个投影长度是不是超过决策线,我们就可以判断这个点的分类...原创 2018-05-22 07:30:29 · 1389 阅读 · 0 评论