改进算法的方法

1.增加样本数量 该方法可以改进高方差问题,从学习曲线可以看出,随着样本量的增加,交叉验证误差和训练集误差越来越接近 2.减少特征 该方法可以改进高方差问题,高方差是过拟合的情况,花时间去选取更少,更合适的的特征 3.增加特征 该方法可以改进高偏差问题,因为假设函数太简单,所以欠拟合,要...

2019-05-12 18:34:02

阅读数 23

评论数 0

学习曲线learning curve

学习曲线是横坐标为训练样本数量,横坐标为误差。画的有两条曲线,一条是训练集误差,一条是交叉验证的误差。 学习曲线可以反应两种情况,一种是高偏差,一种是高方差。 高方差:过拟合,拟合效果过好,但是泛化效果差,无法泛化新的数据 高误差:欠拟合,拟合程度太差,误差太大。 反应在学习曲线上就是: ...

2019-05-12 18:27:02

阅读数 11

评论数 0

python线性插值

在缺失值填补上如果用前后的均值填补中间的均值,比如,0,空,1,我们希望中间填充0.5;或者0,空,空,1,我们希望中间填充0.33,0.67这样。可以用pandas的函数进行填充,因为这个就是线性插值法 df..interpolate() dd=pd.DataFrame(data=[0...

2019-04-25 13:15:12

阅读数 75

评论数 0

拉格朗日插值法补齐数据python

书上的代码,然后具体原理公式先占个坑,以后再详细写 def ployinterp_column(s, n, k=8): # 取出要插值位置的前后k个数据 y = s[list(range(n - k, n)) + list(range(n + 1, n + 1 + k))] # 剔...

2019-04-24 10:16:00

阅读数 38

评论数 0

缺失值处理总结

在测点测数据的时候存在异常值的情况,比如测得值在量程之外,该值没有意义无法使用,归类在异常值中,作异常值处理,将该异常值删除,则问题转化为缺失值处理。缺失值处理的方法有两种,一种是不处理,直接删除,一种是用合适的值去填补。针对我们的业务需求,我们采用填补的方法,缺失值的填补有很多种方法,分享几种主...

2019-04-16 15:49:32

阅读数 87

评论数 0

sql server时间格式24小时制

数据库时间戳要按照格式化输出,有两种方法: 1.Select CONVERT(varchar(100), GETDATE(), 0) 后面的 0 可以换成其他的数字,有对照表可以查询 这是改成了8,可以改成不一样的数字对应不同的结果 2.FORMAT函数 这个函数在MySQL中也...

2019-03-28 10:04:26

阅读数 170

评论数 0

神经网络基础知识

2019-02-13 09:18:38

阅读数 39

评论数 0

RBF神经网络笔记

   

2019-01-23 09:38:13

阅读数 47

评论数 0

python画矢量图

用matplotlib画图有输出的图放大看会很模糊,即使可以使用 fig = plt.figure(figsize=(15,6))#设置画布尺寸 这样设置确实是等比例放大的,但是仔细看还是模糊。 矢量图的话无论怎么方法也是很清楚。 import matplotlib import m...

2019-01-08 16:12:22

阅读数 1657

评论数 0

pip错误 ImportError: No module named _internal

服务器自带的python是2.7,就先安装了pip,后来发现又按不上jupyter了,提示信息说jupyter要依赖python3??怎么会这样,真是服了,之前服务器都好的很,也成功安装,后来因为写教程的原因就重装的系统,从零开始记录,现在又显示错误,也是搞不懂。后来就想着那就全部升级吧,pyth...

2018-12-21 09:34:11

阅读数 1378

评论数 0

JAVA标识符

标识符:在定义java程序时,自定义的一些名字,例如helloworld 程序里关键字class 后跟的Demo,就是我们定义的类名。类名就属于标识符的一种。 标识符规则 标识符由26个英文字符大小写(a~zA~Z)、数字(0~9)、下划线(_)和美元符号($)组成。 不能以数字开头,不能是...

2018-11-09 10:51:15

阅读数 32

评论数 0

常见的DOS命令

盘符:进入指定的盘符下。 dir:列出当前目录下的文件以及文件夹 md :创建目录 rd:删除目录 注意:rd不能删除非空的文件夹,而且只能用于删除文件夹。 cd:进入指定目录 cd..:退回到上一级目录 cd\:退回到根目录 echo "hello java&a...

2018-10-31 17:09:17

阅读数 43

评论数 0

控制python数据框的数据精度

需要从python连数据库提取数据的转为数据框,之前也博文也写过如何将数据库数据转为数据框。 有一个问题是,原数据库的数据是保留15位小数的数据,例如:20.000000000000000,但是如果转为pd.DataFrame后,就只有六位小数。 这是因为在数据框中默认的精度是一个固定值,...

2018-10-12 11:24:36

阅读数 245

评论数 0

欧几里得算法证明

之前在看算法图解提到过欧几里得算法,当时看了一下,就赶紧去找这个算法相关,并将公式推导了一遍,舒畅。今天还是想简单的写一下,记性太差,怕自己忘记。 欧几里得算法要解决的是求两个数最大公约数的问题。 这个算法的过程可以举个例子来展示,如果我要求168和44的最大公约数,用欧几里得算法可以这样求:...

2018-10-10 16:46:58

阅读数 241

评论数 0

数据结构——栈与队列

1.栈(stack) 1.1栈 栈又成为堆栈,是一种受约束的线性表,限制就是只允许在表的一端插入和删除操作。进行插入,删除操作的一端称为栈顶,另一端称为栈底。当一个栈没有元素的时候,称为空栈。向栈插入元素称为进栈或者入栈,删除元素称为出栈或者退栈。因为操作都是在栈顶,所以是后进先出的(Last...

2018-10-09 14:57:27

阅读数 63

评论数 0

数据结构——线性表

1.线性表 线性表(linear list)是n个类型相同元素的有限序列。也就是说线性表具有的性质是: 1)每个元素数据类型相同;2)元素是有限个;3)有顺序之分 线性表根据存储方式可以分为: 线性表可以完成对表中数据元素的访问、添加、删除等操作,表的长度也可以随着数据元素的添加和删除...

2018-10-08 18:54:11

阅读数 27

评论数 0

《算法图解》pdf

1.https://u17250589.pipipan.com/fs/17250589-245841327 点这个,然后点普通下载,就可以等网页自动加载,加载完了右上角有下载图标就可以下载,很清楚 2.百度网盘:https://yun.baidu.com/s/1jIIcexS...

2018-10-08 17:26:40

阅读数 1960

评论数 3

一个简单的用户登陆界面

目前开始学前端一些知识,然后就实践做了一个用户登录界面,觉得学语言就得多实践,就做了一个简单的用户登录界面,虽然奇丑,但是也可以看看结构。 HTML码:  <!DOCTYPE html> <html>...

2018-10-08 10:09:55

阅读数 131

评论数 0

JAVA简单排序

将一组整数数组按照从小到大排序,用简单排序的方法,先找到最小的,然后放在0位,然后后面的再找出最小的放在1位,依次下去排列。目前在学习java中,所以将代码的注释附上,也是自己的理解过程。 public void selectSort (int[] a) { int n = a.length...

2018-10-08 09:49:37

阅读数 52

评论数 0

数据结构——基础

数据结构是计算机存储,组织数据的方式,这些数据是以什么样的形式,来存储,其中不仅包含数据的信息也有数据之间的关系。我觉得这个数据结构是比较抽象的,很多推荐看《算法导论》,目前打算先看一遍入门。做了一个思维导图,最近比较迷做这种框架图,觉得比较清晰。 算法是指令的集合,解决问题的步骤思想都是算...

2018-09-29 18:20:50

阅读数 34

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭