算法
文章平均质量分 88
lhaniey
不积跬步,无以至千里
展开
-
二叉树的遍历
二叉树的遍历分为以下三种:先序遍历:遍历顺序规则为【根左右】中序遍历:遍历顺序规则为【左根右】后序遍历:遍历顺序规则为【左右根】记忆方法:先后中三种遍历方法可以根据遍历根节点的顺序来记忆举例所示: 先序遍历:ABCDEFGHK中序遍历:BDCAEHGKF后序遍历:DCBHKGFEA ...原创 2018-09-25 12:16:46 · 114 阅读 · 0 评论 -
10种机器学习算法(附Python代码)
sklearn python APILinearRegressionfrom sklearn.linear_model import LinearRegression # 线性回归 #module = LinearRegression()module.fit(x, y)module.score(x, y)module.predict(test)Logist...转载 2019-05-10 21:19:29 · 743 阅读 · 2 评论 -
距离计算方法
转载:https://www.cnblogs.com/soyo/p/6893551.html计算推荐对象的内容特征和用户模型中兴趣特征二者之间的相似性是推荐算法中一个关键部分 ,相似性的度量可以通过计算距离来实现在做很多研究问题时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的...转载 2019-05-10 16:44:55 · 1959 阅读 · 0 评论 -
KNN算法
KNN:近朱者赤,近墨者黑,既可以用于分类,也可以用于回归分析。K:一般可以通过交叉验证来确定推荐系统算法:TD-IDF,协同过滤,Apriori 算法,在样本量比较少的情况下可以使用KNN做推荐算法计算距离的方法:欧式距离,曼哈顿距离,闵科夫斯基距离,切比雪夫距离,余弦距离(用于兴趣推荐)运用sklearn自带用的数据集——手写字识别实战练习# -*- coding: ut...原创 2019-05-10 20:54:33 · 234 阅读 · 0 评论 -
机器学习之朴素贝叶斯
1、贝叶斯介绍下式为贝叶斯的一般公式2、朴素贝叶斯应用如何求TF-IDF在 sklearn 中我们直接使用 TfidfVectorizer类;创建方法如下:TfidfVectorizer(stop_words=stop_words, token_pattern=token_pattern)当我们创建好 TF-IDF 向...原创 2019-05-07 14:48:39 · 297 阅读 · 0 评论 -
机器学习之SVM介绍
一、SVMsupport vector machine,在机器学习中,SVM 既可以做回归,也可以做分类器。SVM 主要是帮我们找到一个超平面,使不同的样本分开,并且是各个样本集到超平面的距离之和最大化。支持向量就是距离超平面最近的样本点,确定了支持向量也就确定了超平面。二、硬间隔、软间隔和非线性 SVM硬间隔:在满足线性可分的基础上,分类完全正确,不存在分类出错的情况...原创 2019-05-09 15:53:27 · 933 阅读 · 0 评论 -
LeetCode 338 python刷题
338 的题意:输入一个非负整数num,0 ≤ i ≤ num,输出从0~num 范围内,i转换成二进制所包含的1的个数要求时间和空间复杂度都是O(n)以下是我自己写的性能比较差的代码class Solution(object): def fun1(self,num): sum=0 while num: if ...原创 2019-05-06 19:14:37 · 234 阅读 · 0 评论 -
数据挖掘十大算法
根据算法不同的目的,可以分为四类分类算法:C4.5,朴素贝叶斯,SVM,KNN,Adaboost,SART聚类算法:KNN,EM关联分析:Apriori连接分析:PageRank...原创 2019-05-09 11:13:07 · 275 阅读 · 0 评论 -
python实战+数据分析+决策树
利用决策树预测泰坦尼克号乘客的生存率数据集来源:https://github.com/cystanford/Titanic_Data主要包括两部分数据:训练集train.csv 和测试集 test.csv运用sklearn中运用DecisionTreeClassifier 分类器来进行预测到目前为止,sklearn 中只实现了 ID3 与 CART决策树,在构造 Decisio...原创 2019-04-18 11:26:44 · 1514 阅读 · 1 评论 -
数据分析+python+决策树
决策树:ID3 算法,基于信息增益做判断; C4.5 算法,基于信息增益率做判断 CART算法,基于基尼系数做判断,回归树是基于偏差做判断以下是cart算法分类和预测的实现过程第一个使用的sklearn的iris 数据集,进行分类 第二个使用的sklearn的boston数据集,进行回归预测 第三个使用的sklearn的digits数据集,进行分类# encoding...原创 2019-04-17 19:04:33 · 605 阅读 · 0 评论 -
数据结构——数组PK链表
数组优点:随机访问性强,查找方便且迅速缺点:插入和删除效率低(插入和删除需要移动数据) 可能浪费内存(因为是连续的,所以每次申请数组之前必须规定数组的大小,如果大小不合理,则可能会浪费内存) 内存空间要求高,必须有足够的连续内存空间。 数组大小固定,不能动态拓展,链表优点:插入和删除效率高(可以指向下一个结点) 存储密度低,动态分配内存,不需要有足够的连续内存空...原创 2018-12-13 20:04:19 · 154 阅读 · 0 评论 -
数据结构——线性表知识点回顾
一、线性表分类存储方式:顺序存储——顺序表;链式存储——单链表、双链表、循环链表和静态链表1、顺序表逻辑上相邻、物理位置也相邻顺序表的存储保密度高,每个节点只存储数据元素;线性表的存储结构是一种随机存取的存储结构;一个顺序表的所占用的存储空间大小与元素的存放顺序无关,与表的长度、元素的类型和元素各字段的类型有关;线性表中元素的魏旭需1.1 一维数组可以静态分配和动态...原创 2018-12-12 21:51:19 · 705 阅读 · 0 评论 -
大O表示法
转载:https://blog.csdn.net/Max__Payne/article/details/1872906一. 简介做了几年程序,感觉基本的东西很多还不熟悉,所以重新补充数据结构知识。1.1 大O表示法上学的时候就学习了大O表示法表示一个算法的效率,也大概明白怎么回事,知道如果没有循环的一段程序的复杂度是常数,一层循环的复杂度是O(n),两层循环的复杂度是O(n^2...转载 2018-10-03 16:30:57 · 1446 阅读 · 2 评论 -
Kmeans实战
对20支球队进行聚类分析数据来源:https://github.com/cystanford/kmeans# -*- coding: utf-8 -*-"""Created on Thu May 16 10:05:27 2019@author: Administrator"""from sklearn.cluster import KMeansfrom sklearn ...原创 2019-05-16 11:06:26 · 1744 阅读 · 0 评论