- 博客(54)
- 收藏
- 关注
原创 算法基础-HMM
模型介绍https://www.cnblogs.com/pinard/p/6945257.html前向后向算法https://www.cnblogs.com/pinard/p/6945257.html维特比算法https://www.cnblogs.com/pinard/p/6945257.html
2020-08-10 16:36:27 104
原创 算法基础-EM(无监督)
N(xi|uk,Σk)表示在给定uk,Σk的情况下,第i个样本属于第k个高斯分布的概率密度,πk表示第k个高斯分布本身被选中的概率例子:假设k=2,想知道样本身高属于男还是女,先验性地给定一个男性和女性身高分布的均值u和方差δ,对于每一个样本可以根据上式算出其属于男性和女性的概率。再根据这个概率,把样本对应的值拆分为属于男性的部分,属于女性的部分(如x1=1,98,x有0.9的概率属于男性,0.1的概率属于女性,则x1属于男性的身高为1.782,属于女性的身高为0.198),根据拆分后...
2020-07-05 11:45:03 444 1
原创 算法基础-聚类
利用聚类降维的思想将样本聚类成K个簇,例如k=6,再对其进行one-hot编码这样就将原来mn的样本数据转换成了m6的形式,形成了降维当p=1时,曼哈顿距离:|x1-x2|+|y1-y2|p=2,欧氏距离p=无穷大,切比雪夫距离,|x1-x2|,|y1-y2|谁最大,谁就是距离对应的值杰卡德相似系数例如推荐系统,根据A集合购买的商品,推荐B、C2个集合的商品,如何衡量B、C集合推荐的好坏,用杰卡德相似系数向量空间余弦相似度(Cosine Similarity)余弦相似度用向量空间
2020-06-28 17:10:13 300
原创 算法基础-SVM
w*x+b = 0,w为法向量,x为参数, 若等于0,代表在超平面上,=1代表与法向量同方向,-1,逆方向线性核只有一个参数c,c越大分割面的间距越窄;高斯核有2个参数,γ越大,分割面就越偏非线性,c越大,分割面间距越窄;上式为点到线的距离,如何确定最优直线?先求各个样本点到各直线的最小距离D,使得D最大的那个直线为最优直线。简化后的目标函数是带约束条件的,约束条件的个数等于样本个数...
2020-06-08 16:32:38 281
原创 算法基础-提升
Adaboostem为误差率,误差率越小,am越大,误差率越大,am越小权值的更新是wm+1乘以 exp(*),如果分类分错了,yG(x)<0,am>0,则-amG(x)>0,所以exp(x)>1,相当于权值乘以一个大于1的数,即分类如果分错了,增加权值;同理如果分对了,exp(x)<1,权值会变小。...
2020-05-18 23:20:49 263
原创 ## 线性回归
如何求解系数W方式1 最小二乘法方式2 梯度下降sklearn 版本区别回归性能评估梯度下降和正规方程比较正则化思想:减少参数的权重岭回归(带正则化的线性回归)参数正则化力度α(或者λ)越来越大,高次项的系数越来越小...
2020-04-16 16:29:57 97
原创 梯度下降
关于梯度下降算法的直观理解,我们以一个人下山为例。比如刚开始的初始位置是在红色的山顶位置,那么现在的问题是该如何达到蓝色的山底呢?按照梯度下降算法的思想,它将按如下操作达到最低点:第一步,明确自己现在所处的位置第二步,找到相对于该位置而言下降最快的方向第三步, 沿着第二步找到的方向走一小步,到达一个新的位置,此时的位置肯定比原来低第四部, 回到第一步第五步,终止于最低点按照以上5步,最...
2020-03-04 22:55:42 147
原创 画股票图
画股票图import datetimeimport matplotlib.pyplot as pltfrom matplotlib import styleimport pandas as pdimport pandas_datareader.data as webif __name__ == '__main__': start = datetime.datetime(201...
2019-12-05 10:18:11 250
原创 matplotlib画图
matplotlib画图散点图## s:点大小## c:颜色## marker:点的样式## alpha:透明度x = np.random.randn(1000)y=x+np.random.randn(1000)*0.2plt.scatter(x,y,s=10,c='b',alpha=0.1)plt.show()折线图x=np.linspace(-10,10,5)y=...
2019-12-04 09:31:24 90
原创 matplotlib画图
matplotlib画图import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinex = np.arange(-10,11)plt.plot(x,x**2)``![在这里插入图片描述](https://img-blog.csdnimg.cn/201911282154...
2019-11-28 21:56:41 136
原创 python pandas
python pandaspandas的series和dataFramepandas和numpy的关系:numpy是列表,pandas是字典,pandas基于numpy构建。Series的形式:索引在左边,值在右边。没有为数据指定索引会自动创建0到N-1(N为长度)的整数型索引。DataFrame是一个表格型的数据结构,每列可以是不同的值类型,既有行索引也有列索引。取df的“指标1”...
2019-11-20 09:57:52 449
原创 python pandas
python pandasfrom pandas import *#import pandas as pdimport numpy as np #读取csv、xlsx文件,获得DataFrame数据结构#data = pd.read_csv('filename.csv',header=None)#data = pd.read_excel('filename.xlsx') #将...
2019-11-14 09:59:44 71
原创 python numpy
python numpyNumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型,它是描述相同类型的元素集合。ndarray 中的每个元素都是数据类型对象(dtype)的对象。ndarray 中的每个元素在内存中使用相同大小的块。numpy.array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0...
2019-11-07 16:01:02 97
原创 mysql查询语句
mysql查询语句修改表添加列:alter table 表名 add 列名 类型删除列:alter table 表名 drop column 列名修改列:alter table 表名 modify column 列名 类型; -- 类型alter table 表名 change 原列名 新列名 类型; -- 列名,类型添加主键:alter table 表名 add prim...
2019-10-28 16:37:39 58
原创 mysql基础
mysql基础1.什么是SQL?Structured Query Language:结构化查询语言其实就是定义了操作所有关系型数据库的规则。每一种数据库操作的方式存在不一样的地方,称为“方言”。2.SQL通用语法SQL 语句可以单行或多行书写,以分号结尾。可使用空格和缩进来增强语句的可读性。MySQL 数据库的 SQL 语句不区分大小写,关键字建议使用大写。3. SQL分类...
2019-10-23 14:09:18 94
原创 mysql基础
mysql基础SQL组成部分:1、DDL:数据定义语言,主要用于定义数据库、表、视图、索引和触发器等。Drop, create, alter等2、DML:主要包括对数据的增删改。insert插入数据、update更新数据、delete删除数据3、DCL:数据控制语言,主要用于控制用户的访问权限。像grant,revoke, commit, rollback等语句...
2019-10-21 16:58:04 66
原创 二叉树
二叉树二叉树的三种遍历方法:先序遍历、中序遍历、后序遍历。先序遍历即遍历顺序为“根—>左->右”。中序遍历即遍历顺序为“左—>根—>右”,由于二叉树为有序树,因此中序遍历输出的值由小到大的。后序遍历即遍历顺序为“左—>右—>根”。...
2019-10-17 14:35:04 81
原创 冒泡排序、选择排序、快速排序
冒泡排序、选择排序、快速排序冒泡排序冒泡排序的思想在于,不断地将当前元素与后一个元素进行比较,如果当前元素较小,则调换当前元素与后一个元素的位置,否则保持不变;假设需要排序的元素一共有n个,从第一个元素开始,对后续的(n-2)元素进行上述比较,最终的排序结果中,最后的元素是最大值。def bubble_sort(alist): n = len(alist) for j in ...
2019-10-14 15:48:56 135
原创 Python实现栈和队列
Python实现栈和队列PS:栈、队列的功能都可以通过顺序表、链表禁用某些操作实现class SStack(): #基于顺序表技术实现的栈类 def __init__(self): #用list对象_elems存储栈中元素 self._elems=[] #所有栈操作都映射到list操作 def is_empty(self):...
2019-10-04 16:32:04 131
原创 数据结构:单链表、双链表、单向循环链表
数据结构:单链表、双链表、单向循环链表class Node(object): """节点""" def __init__(self, elem): self.elem = elem self.next = None # 初始设置下一节点为空# 创建单链表,并实现其应有的功能class SingleLinkList(object):...
2019-09-30 10:13:26 235
原创 数据结构:顺序表
数据结构:顺序表基本形式:数据元素本身连续存储,每个元素所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以用过存储区的起始地址加上逻辑地址与存储单元大小的乘积计算得到Loc(ei) = Loc(e0) + c*i访问指定元素时,无需从头遍历,通过计算便可获得对应地址,时间复杂度为O(1)元素外置:若元素大小不一致,则采用元素外置形式,即将数据元...
2019-09-27 13:49:22 252
原创 算法与数据结构
算法与数据结构算法的概念算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。一般地,当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。算法是独立存在的一种解决问题的方法和思想。对于算法而言,实现的语言并不重要,重要的是思想。算法可以有不同的语言描述实现版本。算法的五大特性1、输入:...
2019-09-25 21:13:54 187
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人