算法基础
ckriser
这个作者很懒,什么都没留下…
展开
-
算法图解[Aditya Bhargava]--读书笔记
一、算法复杂度通过时间复杂度表示O(n)二、选择排序1.选择排序三、递归1.递归两点2.递归调用栈一、算法复杂度通过时间复杂度表示O(n)大O表示法是一种特殊的表示法,指出了算法的速度有多快。 一些常见的大 O 运行时间:O(log n),也叫对数时间,这样的算法包括二分查找。O(n),也叫线性时间,这样的算法包括简单查找。O(n * ...原创 2018-07-02 23:26:13 · 1656 阅读 · 1 评论 -
NLP文本分类--词向量
1.基于规则,对于要提取的分类维护一个dict,在dict里面保存需要提取的关键词,存在关键词的对应标记为分类;(缺点,不断的去维护词典)2.基于机器学习:HMM(分词最常用的),CRF,SVM,LDA,CNN3.词袋模型:bag of word :(one hot)一种是统计词频和位置,一种是只存储是否出现;(缺点很明显,只有词出现信息,对于词的重要度完全没有体现)4.tf-idf:先考虑...原创 2018-10-12 23:55:35 · 5793 阅读 · 0 评论 -
机器学习入门之十大算法
决策树随机森林逻辑回归SVM贝叶斯算法K最近邻K均值Adaboost神经网络马尔可夫原创 2018-08-20 16:08:49 · 181 阅读 · 0 评论 -
PageRank算法
PageRank由来原创 2018-08-20 11:45:40 · 6578 阅读 · 0 评论 -
黑塞矩阵(海森矩阵,Hessian Matrix)与牛顿法最优化
DDDDDDDDDDD原创 2018-08-19 11:02:46 · 9837 阅读 · 0 评论 -
机器学习基础-损失函数,范数
一、统计学中常见的损失函数有以下几种:1.0-1损失函数(0-1 loss function) L(Y,f(x))={1,Y≠f(X)0,Y=f(X)L(Y,f(x))={1,Y≠f(X)0,Y=f(X) L(Y,f(x)) = \begin{cases} 1, Y \neq f(X)\\0, Y = f(X)\end{cases} 2.平方损失函数(quadratic loss...原创 2018-08-10 17:08:56 · 2924 阅读 · 0 评论 -
EM(Expectation Maximization)算法
一、EM由来很多时候对EM算法产生疑惑是不清楚这个算法是怎么来的,为什么这样;又有什么样的用途。其实EM算法和朴素贝叶斯算法都是在用概率的观点通过已经观测到的数据(或者说样本)来推测未知的数据(这个样本对应的整体的概率样本分布);而EM算法比朴素贝叶斯更近的一步是其中的隐含变量更多;无法通过朴素贝叶斯的计算方法直接求出所有变量;他们的共同点都是统计学观点,通过极大似然的估计的思想来进行求解...原创 2018-08-04 14:08:54 · 786 阅读 · 0 评论 -
机器学习十大算法之三K-means
K-means算法 (无监督算法,聚类算法)K-means算法,也称为K平均或K均值算法; K平均聚类的目的是:把n个点(可以是样本的一次观察或一个实例)划分到k个聚类中,使得每个点都属于离他最近中心点的距离最近(或者说相似度上更相近的)对应的聚类。 1.从定义可以看出Kmeans主要是通过K中心和对K中心的距离计算进行聚类;所以K-means主要问题是K值选取和距离(相似度衡量)使...原创 2018-07-16 18:08:35 · 3062 阅读 · 0 评论 -
机器学习十大算法之四:SVM(支持向量机)
SVM(支持向量机)支持向量机(Support Vector Machine)是一种十分常见的分类器,曾经火爆十余年,分类能力强于NN,整体实力比肩LR与RF。核心思路是通过构造分割面将数据进行分离,寻找到一个超平面使样本分成两类,并且间隔最大。而我们求得的w就代表着我们需要寻找的超平面的系数 ,如下图: ...原创 2018-07-23 11:50:56 · 1008 阅读 · 0 评论 -
机器学习十大算法之一:决策树
一、决策树模型概述1.决策树模型(Decision Tree Model)出发点:模拟人决策思想的过程,决策树基于树结构进行预测。是一种树形结构,每个内部节点表示一个属性上的判断每个分支对应该判断的一种可能结果(即该属性的某个取值)每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。学习过程:通过对训练样本的分析(通过信息熵等)来划分树的结构,确定树节点对应的属性;...原创 2018-07-04 22:33:55 · 2095 阅读 · 0 评论 -
机器学习十大算法之二:KNN
一、KNN(K Near Neighbor)算法详解一、概念:KNN(K Near Neighbor):k个最近的邻居,即每个样本都可以用它最接近的k个邻居来代表。 如:“近朱者赤,近墨者黑” 最近邻 (k-Nearest Neighbors, KNN) 算法是一种分类算法, 1968年由 Cover和 Hart 提出, 应用场景有字符识别、 文本分类、 图像识别等领域。 该算法...原创 2018-07-10 20:44:37 · 542 阅读 · 0 评论 -
机器学习常用距离
一、欧氏距离(Euclidean Distance):欧氏距离是最容易直观理解的距离度量方法,我们小学、 初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 二维平面上点a(x1,y1)与b(x2,y2)间的欧氏距离: d12=(x1−x2)2+(y1−Y2)2−−−−−−−−−−−−−−−−−−−√d12=(x1−x2)2+(y1−Y2)2d_{12}=\sqrt{(x_1...转载 2018-07-03 13:33:20 · 400 阅读 · 0 评论 -
推荐算法实战-基于用户的推荐(use_base)
代码实现是基于:推荐系统实战-----项亮;import pandas as pditems_data = pd.read_csv("items_action_2.csv")items_data.head() Unnamed: 0 attentions 0 0 ...原创 2018-11-01 22:54:48 · 1157 阅读 · 0 评论