自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 Python每日一记42>>>机器学习中特征重要性feature_importances_

在进行机器学习算法中,我们常用的算法就像下面的代码形式类型经历导入数据-预处理-建模-得分-预测但是总觉得少了点什么,虽然我们建模的目的是进行预测,但是我们想要知道的另一个信息是变量的重要性,在线性模型中,我们有截距和斜率参数,但是其他机器学习算法,如决策树和随机森林,我们貌似没有这样的参数值得庆幸的是我们有变量重要性指标feature_importances_,但是就目前而言,这个参数好...

2019-04-30 13:23:42 24461 6

原创 Python每日一记41>>>groupby 和flatten使用

我的源数据是每个会员卡的每笔消费,主要包括字段卡号,交易时间,销售金额我想要做的事是求每个卡号的消费天数,及这个会员的消费金额源数据如下想要得到的结果如下,注意卡号一列就是代表天数代码如下:首先我们先不看正确的代码,我想要回溯一下我走过的坑我们要得到最后的结果,第一步就要先得到下面的表,也就是我们要看各个卡号在那些日期消费过,且金额是多少,要得到这个表很简单,无论你是用exc...

2019-04-27 11:35:57 988 1

原创 Python每日一记40>>>map()函数

我有一列时间数据,想要提取其中的时间并单独成为对应的一列,正常的想法是循环,然后append,但是在网上查询后发现,map函数可以实现这样的功能。map(func,list)函数,前面一个参数是函数,后面一个是序列、或者元组等。该函数的意义是对一个序列的每一个元素进行前面参数函数的操作,然后返回一个迭代器,再加上list即可返回列表如果我们没有加list,我们得不到我们想要的结果另外需...

2019-04-22 20:31:47 127

原创 Python每日一记39>>>pandas创建数据透视表&多维数据问题

为了更好的达到数据的分类汇总功能,pandas也准备数据透视表功能需要说明的是:index=代表行标签,columns=代表列标签,value=代表值标签,aggfunc=代表计算方式,len代表计数可以多个行列标签,这就对应多维数据,aggfunc使用字典方式就是分别对不同的值采用不同的计算方式。那更重要的是,我们创建了数据透视表,想要使用其中的数据怎么办,也就是说,我们该怎么引用呢。...

2019-04-21 11:50:11 1518

原创 Python每日一记38>>>pandas相关小问题

最近在做新会员,老会员,离返会员的建模分析,在使用pandas中遇到很多问题1、关于pandas中update的报错cannot reindex from a duplicate axis这个问题显示你的dataframe的行索引有重复,重新索引编码即可。我的问题是因为我将两个数据框concat后,索引有重复的。网上有很多解释,但是只有重新编码行索引才解决了我的问题df.index=[ ...

2019-04-15 22:39:18 264

原创 Python每日一记37>>>pandas处理时间数据

python中时间数据区别与常规的数字数据类型。我们先读取一个excel数据看看我们发现时间数据的类型是dtype: datetime64[ns],这是因为pandas继承了numpy的datetime64和timedelta64模块。1、字符串转化为日期时间2、时间转化为DatetimeIndex、PeriodIndex均是index类,可以作为索引使用3、提取时间序列信...

2019-04-13 23:21:25 256

原创 Python每日一记36>>>机器学习实战遇到的问题

首次进行机器学习实战,但是问题多多。我想做的事是,考察年龄,区域,性别与消费部类的关系,采用机器学习随即森林算法进行训练并进行预测。先上代码大家不用过分在意代码,我想要分享的是我在这个过程中遇到的问题。1、ImportError: DLL load failed: 找不到指定的模块。在公司的电脑上,导入机器学习库不会出现问题,但是在自己的电脑则出现了,况且我明明已经pip install ...

2019-04-13 20:13:56 238

原创 Python每日一记35>>>函数基础知识

前段时间开始忙碌,因此均没有进行记录,但是依然每天有相关学习,主要将python函数的相关知识进行了复习,下面进行一些知识的记录。1、形参和实参定义以下求最大值得函数,其中形参就是括号中的a,b,实参就是9,102、参数的类型参数的类型包括位置参数,默认值参数,命名参数,可变参数,强制命名参数#位置参数def printmax(a,b,c):if max(a,b,c)==a:p...

2019-04-12 11:22:22 386

原创 Python 每日一记34>>>pandas多条件筛选,写多sheet的excel

在今天的工作中,又遇到了一些小问题。都是关于pandas操作excel的。一是多条件筛选数据,二是将数据写如excel,但是要保存在同一个工作簿的多个sheet。先上一个完整代码源数据是这样的:得到的结果是:我在做的是,得到不同级距(门槛)下‘人数’,‘占比’,‘达到级距会员客单’,‘会员客单’,并循环保存在同一个工作簿下的不同工作表内。现在说一下我遇到的问题:1、pandas...

2019-04-06 21:57:31 4922

原创 Python 每日一记33>>>zip、推导式创建序列

AI 前线导读: 图神经网络 (GNN) 主要是利用神经网络处理复杂的图数据,它将图数据转换到低维空间,同时最大限度保留结构和属性信息,并构造一个用于训练和推理的神经网络。在实际应用中,为了加速 GNN 训练和新算法的快速迭代,设计一套统一的图计算框架面临着巨大的挑战。近日,阿里巴巴在阿里云峰会北京站上重磅推出了大规模图神经网络平台 AliGraph,本文是 AI 前线第 74 篇论文导读,我们将...

2019-04-06 09:37:10 163

原创 Python 每日一记32>>>for/while循环与if结构

清明小长假照常上班,还是很开的啦,毕竟放假外出简直就是遭罪,更何况放假就是百货公司业绩爆发的时间段啦。今天分享for循环和if结构相关知识,将程序看成是房子,那么语句结构就是砖瓦,其中for循环和if结构又是最为重要的组成部分。1、for循环我们会常见到一下的循环结构这是一个三层循环,我们可以任意的嵌套多个循环,只是,循环越多运行速度就越慢,注意缩进和冒号,python中以缩进区别不同的...

2019-04-05 11:30:11 158

原创 Python 每日一记31>>>相关性矩阵建立

AI 前线导读:2019 年 4 月,Java 的收费时代来临了!Java 是由 Sun 微系统公司在 1995 年推出的编程语言,2010 年 Oracle 收购了 Sun 之后,Java 的所有者也就自然变成了 Oracle。2019 年,Oracle 宣布将停止 Java 8 更新的免费支持,未来 Java 的更新只适用于已付费的许可证持有者。—以上摘自公众号AI前线。之前在Python...

2019-04-04 17:33:44 1142

原创 Python每日一记30>>>字典与集合

相对与列表和元组而言,字典是更加宽泛的,字典是键值对的组合,而集合其本质是字典的键的组合,键具有唯一性。a={}#创建空字典a=dict()a=dict.fromkeys([‘name’,‘age’])#创建值为空的字典a={‘name’:‘jack’,‘age’:18}#创建字典a=dict(name=‘jack’,age=18)#dict()创建字典k=[‘name’,‘age’]...

2019-04-03 11:02:07 338

原创 Python每日一记29>>>列表与元组

Python 软件基金会宣布,到 2020 年元旦,将不再为编程语言 Python 2.x 分支提供任何支持。这一天将标志着一出延续多年的戏剧的高潮:Python 从较旧的、功能较弱的、广泛使用的版本过渡到更新的、更强大的版本。然而,Python 的新版本在采用上仍然落后于它的旧版本。未来几年里,还会有很多人继续使用 Python 2 编写的程序,当世界被 Python 3 迅速占领之时,受困于寿...

2019-04-02 23:11:07 223

原创 Python每日一记28>>>字符串及其相关操作

虽然字符串相对与数字而言更加少用,但是真正的复杂处理却在字符串的处理,因此本次将分享字符串的相关操作。几个重要的转义字符\ 续行符\反斜杠符\t 制表符\n 换行符’ 单引号符我们平时常用的print(1,end=‘\n’),默认的结束标志是换行符号,所以当我们多个print()时候,会换行打印,我们也可以指定其他end.从控制台获得字符串 name=input(“请输入你的名...

2019-04-01 22:39:54 146

原创 Python每日一记27>>>变量、整数、浮点数

考虑到基础不牢的情况,此篇文章开始对基础知识的学习进行记录,期间会不定得有非基础知识。大部分基础知识均学习自网上免费视频,或者python基础书籍,希望自己能对python的基础更加扎实一点,为后续的良好扩展学习提供充足的弹药。python不需要对变量进行显示的声明,直接赋值即可,自动识别变量的类型,并且不同的变量类型对应不同的运算方式。我们来看看a=3这个变量赋值内部到底发生了什么...

2019-04-01 15:07:35 387

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除