自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

转载 训练集、验证集、测试集、交验验证的理解

在人工智能机器学习中,很容易将“验证集”与“测试集”,“交叉验证”混淆。一、三者的区别训练集(train set) —— 用于模型拟合的数据样本。验证集(development set)—— 是模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估。在神经网络中, 我们用验证数据集去寻找最优的网络深度(number of h...

2019-08-15 17:07:46 1892

原创 交叉验证(Cross Validation)

交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。     根据切分的方法不同,交叉验证分为下面三种:       第一种是简单交叉...

2019-08-15 16:49:36 440

原创 机器学习三要素:模型、策略和算法

机器学习在干嘛?就是利用已有数据,找到一些合适的数学模型去描述它,然后做一些预测分析,从而优化企业的流程或者提高决策效率。机器学习的核心是:模型、策略和算法机器学习的目的——模型(Model)模型就是用来描述客观世界的数学模型,模型是从数据里抽象出来的。在进行数据分析时,我们通常手上只有数据,然后看数据找规律,找到的规律就是模型。就跟我们小时候做猜数字游戏似的,1,4,16...()......

2019-08-15 12:28:26 2404

原创 np.random.seed() 理解

在使用numpy时,难免会用到随机数生成器。numpy.random.seed(),随机数种子,每次可以生成相同的随机数。两个问题:1.利用随机数种子,每次生成的随机数相同,如何理解?2.随机数种子的参数怎么选择?经常看到np.random.seed(Argument),这个参数不一样,有的是0,有的是1,当然还有其他数,那么如何选择参数呢?以np.random.randn()函数...

2019-08-13 11:16:19 1299

原创 Python中的赋值、浅拷贝与深拷贝

首先需要了解下几个概念变量:是一个系统表的元素,拥有指向对象的连接空间 对象:被分配的一块内存,存储其所代表的值 引用:是自动形成的从变量到对象的指针 类型:属于对象,而非变量 不可变对象:一旦创建就不可修改的对象,包括字符串、元组、数值类型(该对象所指向的内存中的值不能被改变。当改变某个变量时候,由于其所指的值不能被改变,相当于把原来的值复制一份后再改变,这会开辟一个新的地址...

2019-08-08 17:14:28 228

原创 python中list和array的区别

numpy.array可以专门表示二维或多维数据 b=np.array(a) >>barray=([[1,2,3], [4,5,6], [7,8,9]])总结两点不同的地方:1.元素类型list是python的...

2019-08-07 10:52:57 5595 1

原创 精确率、召回率、F1值、ROC、AUC各自的优缺点

性能度量:为了了解模型的泛化能力,需要一个指标来衡量,这就是它的意义。主要讨论与分类有关的一些指标:1.混淆矩阵:可以这么理解:s1,先看预测结果(P/N);s2,再根据实际表现对比预测结果,给出判断结果(T/F)。TP:预测为1,预测正确,即实际为1;FP:预测为1,预测错误,即实际为0;TN:预测为0,预测正确,即实际为0;FN:预测为0,预测...

2019-08-06 11:44:19 2448

转载 批量重命名文件

这里有两种方法,最简单的就是直接使用Windows自带的批量重命名方法;但是这种方法有缺陷,只能以固定的命名规律来命名。另一种方法就是通过dos命令来批量修改文件名。Windows自带的批量重命名选定所有你想修改的文件,然后右键菜单选择重命名,接下来输入随便一个名字,比如 photo,然后回车确定。接下来你就会看到被选中的 n 张图片都被重命名为从 photo (1) 到 photo (n) ...

2019-07-29 20:13:47 433

转载 重建二叉树

题目描述输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。以中序和前后序建成树的思想已经不用再阐述了,遍历树主要靠的是递归代码展示class TreeNode: def __init__(...

2019-07-18 12:35:31 137

转载 (ID3、C4.5、CART、随机森林、GBDT)

注:本篇文章也是多个博客的综合整理。1、决策树基本问题1.1定义我们应该设计什么的算法,使得计算机对贷款申请人员的申请信息自动进行分类,以决定能否贷款?一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话:女儿:多大年纪了?母亲:26。女儿:长的帅不帅?母亲:挺帅的。女儿:收入高不?母亲:不算很高,中等情况。女儿:是公务员不?母亲:是,在税务局上...

2019-07-15 16:10:52 349

转载 梯度下降法及实现

梯度下降的场景假设 梯度 梯度下降算法的数学解释 梯度下降算法的实例 梯度下降算法的实现 Further reading本文将从一个下山的场景开始,先提出梯度下降算法的基本思想,进而从数学上解释梯度下降算法的原理,最后实现一个简单的梯度下降算法的实例!梯度下降的场景假设梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景:一个人被困在山上,需要从山上下来(i....

2019-07-08 15:51:55 167

原创 Random_Logistic_regression中get_support()方法

使用随机逻辑回归模型进行特征筛选,使用get_support方法获取结果时出现以下错误:IndexError: boolean index did not match indexed array along dimension 0; dimension is 9 but corresponding boolean dimension is 8解决办法:get_support(indic...

2019-06-23 21:09:26 4715 11

原创 range()、np.arange()总结

range()和xrange()函数在 python 2.x 版本中,同时存在range() 和xrange() 函数,其中,range() 返回值是一个列表,xrange() 返回值是一个迭代器; 在 python 3.x 版本中,取消了xrange() 的定义,仅保留了range() 函数,且range() 函数的返回值也改为迭代器; xrange和range的语法格式相同; 语法:...

2019-06-17 15:51:12 2065

原创 《Python数据分析与挖掘实战》案例--财政收入影响因素分析及预测模型

Python3中运行出现错误,故修改其中一小部分代码使其正常运行:1、错误:KeyError:range(1994,2014)、原代码: f = GM11(data[i][range(1994, 2014)].as_matrix())[0]修改后:f = GM11(data[i][0:-2].as_matrix())[0]修改理由:(1)切片不能用自定义索引,索引可以用自定义索引(...

2019-06-15 17:50:08 4240 2

原创 pandas 写数据到mysql,pymysql.err.InternalError: (1366, "Incorrect string value: .' for column at row **

panda写数据到mysql,出现以下错误:pymysql.err.InternalError: (1366, "Incorrect string value: '\\xE6\\x8B\\xBF\\xE5\\xB7\\xA5...' for column `test`.`cleaned_gzdata`.`fullURL` at row 7765")解决方法:engine = crea...

2019-06-13 19:27:49 2356

原创 ARIMA模型

1.模型介绍ARIMA,差分自回归滑动平均模型,又称求自回归滑动平均模型,是时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA是“滑动平均”,q为滑动平均项数;d是使之成为平稳序列所做的差分次数(阶数)。2.ARIMA模型运用流程以《应用系统负载分析与磁盘容量预测》为案例:- (平稳性检验)根据时间序列的散点图、自相关系数和偏自相关系数...

2019-06-12 17:25:14 16973

转载 关于Pycharm安装扩展包的方法

1.pip install ....一般的pycharm都自带有pip,如果没有,就去下一个pip的安装包,将安装包解压在Python的根目录,搭建好Python的环境,然后用Python来安装pip,基本上就可以在pycharm的Terminal界面或者命令提示界面直接安装想要的扩展包了可以用pip install来安装,用pip list查看已安装的包用pip uninsta...

2019-05-29 17:21:41 1290

原创 python 切片操作解读

一、python可切片对象的索引方式 包括:正索引和负索引两部分,如下图所示,以a=[0,1,2,3,4,5,6,7,8,9]为例:二、python切片一般操作一个完整的切片表达式包含两个":",用于分隔三个参数(start_index、end_index、step),当只有一个":"时,默认第三个参数step=1。切片操作基本表达式:object[start_inde...

2019-04-25 12:02:44 1163

原创 顺序处处结构的插入与删除

1. 获得元素操作#define OK 1#define ERROR 0#define TRUE 1#define FALSE 0typedef int Status;/*Status是函数的类型,其值是函数结果状态码,如OK等*//*初始条件:顺序线性表L已存在,1<=i<=ListLength(L)*//*操作结果:用e返回L中第i个数据元素的值*/Status GetElem(S...

2018-05-04 18:06:51 349

原创 线性表的顺序存储结构

定义:线性表的顺序存储结构,指的是用一段地址连续的存储单元依次存储线性表的数据元素。线性表顺序存储的结构代码:#define MAXSIZE 20    /*存储空间初始分配量*/typedef int ElemType;    /*ElemType类型根据实际情况而定,这里假设为int*/typedef struct{    ElemType data[MAXSIZE];    /*数组存储数据...

2018-05-04 17:18:41 247

原创 线性表的抽象数据类型

一  线性表的定义:ADT 线性表(List)Data        线性表的数据对象集合为{a1,a2,......,an},每个元素的类型均为DataType。其中,除第一个元素a1外,每一个元素有且只有一个直接前驱元素,除了最后一个元素an外,每一个元素有且只有一个后继元素。数据元素之间的关系是一对一的关系。Operation        InitList ( *L ) : 初始化操作,建...

2018-04-23 11:07:43 1990

原创 如何使用Sublime Text 3写 h5 代码

1 安装 Package Control  ctrl + ` 呼出控制台  复制(引号内的代码,该代码仅适用于sublime text 3)“  import urllib.request,os; pf = 'Package Control.sublime-package'; ipp = sublime.installed_packages_path();urllib.re

2018-01-25 17:45:01 4439

原创 解决eclipse中导入工程出错问题

有时候导入别人的工程时会出现很多错误,就连一个简单的String下面都会有一个红色的波浪线。解决问题的方法如下:右击工程->Properties->选择自己的android版本,(也可以使用快捷键Alt+Enter)就可以了

2015-08-18 10:32:49 1024

原创 Unable to resolve target 'android-14'

在Eclipse中导入android工程时,出现错误提示:Unable to resolve target 'android-14'解决方法:打开此工程下的project.properties,将 target=android-14 改成你机器上配置的android版本号即可。    例如:target=android-18

2015-08-12 18:04:56 512

翻译 解决桌面图标全都变成记事本的格式

今天我用记事本打开了一个叫javaw.exe的东西,然后桌面上的图标好多都变成了记事本的样子,用记事本打开后出现的是很多乱码。后来在网上百度了一下,方法如下:在桌面上新建一个文本文档,将以下代码粘贴进去,然后命名成后缀名为.inf的格式,右击->安装,就好了。[Version]Signature="$Chicago$"[DefaultInstall]De

2015-07-28 21:39:43 12320

原创 Day_02_数据库的简单连接和添加数据

//检测数据库是否连接成功package cn.edu.hpu.day_2;import java.sql.Connection;import java.sql.DriverManager;public class DBContest {public static void main(String[] args) throws Exception { Class.forName("com

2015-07-24 21:27:37 392

原创 Day_01_简单类的继承

父类car:车的奔跑速度,类型,颜色子类Kache:复写父类中的三个方法子类Moto:复写父类中的三个方法测试类Test1:分别输出车的速度,类型,颜色实现源代码://父类package Acm.day01;public class Car {public void Run(){System.out.println("极速");}publ

2015-07-24 19:34:22 517

原创 Day_01_猜拳游戏

电脑随机生成一个1-3的数,石头(1),剪刀(2),布(3),用户手动输入一个1-3的数字,比较输赢源代码:package cn.edu.hpu;import java.util.Scanner;public class CaiQuan {public static void main(String[] args){int computernumber

2015-07-24 18:14:18 812

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除