![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
forward&forever
fight & fire
展开
-
pandas中cumsum的用法
看了网上流传的讲解,太多雷同和错误,自己尝试了一下,做个记录:1.首先定义一个df,包含两列2.根据class列进行分组后,统计score列的累积值df['result']=df.groupby['class']['score'].cumsum()3.结果4.总结网上的df['score'].groupby['class']cumsum()写法会报错,应该是新版本的问题吧...原创 2021-08-25 11:41:33 · 1041 阅读 · 0 评论 -
银行借贷评分卡项目
一、数据预处理1、读入数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata=pd.read_csv(r'rankingcard.csv',index_col=0)data.head()看一下冰山一角的真实数据,像年龄,收入这样连续型的数据,肯定是需要先做个分箱操作的(先提一下)。2 、简单的预处理去重 重置索引 填补缺失值这里家庭成员数(NumberOfDependen原创 2020-11-27 23:48:24 · 880 阅读 · 0 评论 -
置信度
所谓置信度,也叫置信水平。它是指特定个体对待特定命题真实性相信的程度.也就是概率是对个人信念合理性的量度。概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。向左转|向右转扩展资...原创 2019-12-31 15:19:25 · 8923 阅读 · 0 评论 -
训练集、验证集和测试集的意义
在有监督的机器学习中,经常会说到训练集(train)、验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别。1划分如果我们自己已经有了一个大的标注数据集,想要完成一个有监督模型的测试,那么通常使用均匀随机抽样的方式,将数据集划分为训练集、验证集、测试集,这三个集合不能有交集,常见的比例是8:1:1,当然比例是人为的。从...转载 2018-06-13 00:21:53 · 412 阅读 · 0 评论 -
Maven之(一)Maven是什么
首先,Maven的正确发音是[ˈmevən],而不是“马瘟”以及其他什么瘟。Maven在美国是一个口语化的词语,代表专家、内行的意思,约等于北京话中的老炮儿。一个对Maven比较正式的定义是这么说的:Maven是一个项目管理工具,它包含了一个项目对象模型 (POM:Project Object Model),一组标准集合,一个项目生命周期(Project Lifecycle),一个依赖管理系统(D...转载 2018-06-27 17:49:31 · 203 阅读 · 0 评论 -
LSTM原理及实现
转载:https://blog.csdn.net/gzj_1101/article/details/79376798LSTM网络long short term memory,即我们所称呼的LSTM,是为了解决长期以来问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。LSTM 同样是这...转载 2019-03-01 16:43:43 · 356 阅读 · 0 评论 -
mnist实战笔记了解官方mnist数据格式
我们都知道tensorflow自带的mnist库,那么这个库里面的文件是以什么形式保存的呢?我们该怎么把mnist里面数据转化成图像呢?首先看mnist数据格式from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_hot=Tr...转载 2019-06-14 13:58:05 · 656 阅读 · 0 评论