- 博客(15)
- 收藏
- 关注
原创 关于图的搜索算法
1. 广度优先算法: 可以想象为以A为根,构建一棵树的过程,从顶部向下逐步增加层次广度优先搜索能保证在增加层次之前,添加了所有兄弟节点到树中 说明: 从起始顶点A开始, 作为刚发现的顶点,标注为灰色, 距离为0, 前驱为None,加入队列, 接下来是个循环迭代过程: 从队首取出一个顶点作为当前顶点;然后遍历当前顶点的邻接顶点,如果是尚未发现的白色顶点,则将其颜色改为灰色(已发现),距离增加1,前驱...
2020-04-09 15:14:38
965
原创 C++中值传递、地址传递与引用传递
1.值传递 所谓值传递,就是函数调用时实参将数值传入给形参 值传递时,如果形参发生改变,并不会影响实参 void swap(int a, int b) { int temp = a; a = b; b = temp; cout << "swap函数中a = " << a << "\ta的指针为:" << &a << ...
2020-04-08 17:05:01
6198
原创 平衡二叉树(AVL)
一、 AVL树的定义 AVL树的名字来源于它的发明作者G.M. Adelson-Velsky 和 E.M. Landis。 AVL树是最先发明的自平衡二叉查找树(Self-Balancing Binary Search Tree,简称平衡二叉树)。 平衡二叉树定义(AVL):它或者是一颗空树,或者具有以下性质的二叉排序树:它的左子树和右子树的深度之差(平衡因子)的绝对值不超过1,且它的左子树和右...
2020-03-26 12:03:00
633
1
原创 使用Python将Excel中的数据导入到MySQL
使用python将Excel中的数据导入到Mysql中 1.使用sqlalchemy模块,直降将整个Excel表格导入到Mysql中,代码如下: from sqlalchemy import create_engine #将Excel表格中的数据放到MySQL中 path = r'G:\数据集\记录信息(10月).xls' data=pd.read_excel(path) #这里是对data.c...
2020-03-25 21:16:42
5697
原创 python中实现坐标轴的共享
plt作图时实现坐标轴的共享 功能:实现一张fig中不同ax的坐标轴的共享,使图看起来更加简洁与高效 import numpy as np import pandas as pd import matplotlib.pyplot as plt # First create some toy data: x = np.linspace(0, 2 * np.pi, 400) y = np.sin(x...
2020-01-09 10:21:23
3242
原创 正态性与方差齐性
正态性与方差齐性 正态性,严格来说是残差要符合正态分布,不过我们经常对因变量直接进行正态性检验,在多数情况下两者是差不多的 方差齐性,就是方差相等,意思是对于每一个x取值,因变量(严格来说是残差)的方差基本相等。 用统计检验方法判断正态性 基于峰度与偏度的SW检验 SW检验的思想是基于偏离峰度或/和偏度。峰度通俗讲就是分布的形状是平坦还是尖峰;偏度则反映了分布形状是否对称。 正态分布的峰度和偏...
2019-12-23 11:46:40
10149
原创 最大互信息系数
对最大互信息系数的一些思考 最大互信息系数(MIC) MIC(Maximal Information Coefficient)最大互信息系数。用来衡量两个特征变量之间的关联程度(线性或非线性关系),相较于Mutual Information(MI)互信息而言有更高的准确度。其主要思想是:如果两个变量之间存在一定的相关性,那么在这两个变量的散点图上进行某种网格划分之后,根据这两个变量在网格中的近似概...
2019-12-22 18:54:15
9344
3
原创 在python中实现多坐标轴的绘制
在python中实现多坐标轴的绘制 实现的效果如下图所示: 其中注意点: ax.set_frame_on(True) #frame代表边框 ax.patch.set_visible(False) #patch代表填充 for sp in ax.spines.values(): #spines代表坐标轴 sp.set_visible(False...
2019-12-20 15:31:27
4444
原创 统计基础知识
基本概念 - 抽样误差 在一个总体(包括全部个体)中抽取样本(包括全部个体中的部分个体),样本统计量之间的差异就体现了抽样误差。由于抽样误差的存在,如果用样本统计量直接估算总体参数,则肯定会有一定的误差,所以在估计总体参数的时候需要考虑到这种偏差的存在,即用置信区间来估计总体参数。 - 标准误 标准误则可以通过一次样本来计算抽取误差的大小。如果标准误较小,则说明抽样误差小,意味着样本很稳定,对总体...
2019-12-19 17:16:37
440
原创 实用统计学方法
实用统计学方法欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 欢迎使用Markd...
2019-12-18 17:29:08
1109
原创 KNN算法
根据机器学习实战上的代码,有自己完成KNN算法的简单实现,在这里做一个记录 `filename=r’./datingTestSet.txt’ file=pd.read_csv(filename,sep=’\t’,header=None) returnMat=file.iloc[:,0:3] data_norm = returnMat.apply(lambda x: (x - np.min(x)) ...
2019-10-28 21:27:07
182
原创 波士顿房价问题
1.grid = GridSearchCV(xgb_model, param_grid, cv=cv_split, scoring=‘neg_mean_squared_error’)#neg代表是负数 scoring=‘neg_mean_squared_error’,表示用MSE作为评价指标,MSE是非负的,且越接近于0越好。但在GridSearchCV中会选择得分最大的模型,因此在MSE前面一个...
2019-07-24 20:29:10
4252
原创 用鸢尾花数据集为例展示数据分析的一般流程
数据分析的一般过程: 数据的获取 数据预处理(标准化或归一化) 模型的训练(训练集、测试集) 模型的评估(交叉验证) 模型的优化 交叉验证目的:测试某个算法在一个数据集上的应用的好坏。 交叉验证方法: K倍交叉验证(K>=2)。将样本数据集随机划分为K个子集(一般是均分),将一个子集数据作为测试集,其余的K-1组子集作为训练集;将K个子集轮流作为测试集,重复上述过程,这样得到了K个分类器或...
2019-05-16 22:30:33
2096
原创 python实现人脸识别
python实现人脸识别 第一步:获取人脸 1.pathf需要是haarcascade_frontalface_default.xml在自己电脑中的路径 2.face_id表示是那个人的脸,sample_num表示每个人的脸下面有多少张图片 #-----Stage 1----- #-----获取人脸样本----- import numpy as np import cv2 pathf=r'E:\v...
2019-05-13 17:26:18
3700
原创 神经网络算法
** 在学习神经网络过程中的疑惑及思考 ** 1.在神经网络的训练过程中需要先随机设定所有的权重值(有随机的方法),然后才可以再利用反向算法进行权重的逼近 2.神经网络的输入层的个数是数据的特征数量,输出层是最后的结果种类,隐藏层个数的设定需要一定的经验(经验公式) 3.在神经网络的编程实现中,第一层,需要设置偏置项为1,但根据随机权重的设置,在第二层中偏置项的数值将不会再是1. 4.随机权重的维...
2019-05-13 17:11:39
240
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅