自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 itertools模块中的product方法

itertools.product(*iterables[, repeat])笛卡尔积创建一个迭代器,生成表示item1,item2等中的项目的笛卡尔积的元组,repeat是一个关键字参数,指定重复生成序列的次数。代码示例如下:import itertoolsa = (1, 2, 3)b = ('A', 'B', 'C')c = itertools.product(a,b)for ...

2019-07-30 15:52:20 985

原创 关于在数据建模中python库tqdm的使用

有时候跑循环处理大数据需要很长的时间,维持tqdm可以是一个监控器的作用,形成可视化的进度条,使用起来非常方便。方法一:方法二:

2019-07-30 10:41:33 194

原创 时间序列的基本知识

1、时间图对于时间序列数据而言,我们从最简单的时间图开始。时间图是用将观测值与观测时间点作图,散点之间用直线连接。例如图2.1表示在澳大利亚两个最大的城市之间,Ansett航空公司的每周客流量。例如以下图形:该时间图直观地展现出数据具有的一些特征:由于1989年当地的工业纠纷,当年的客流量为0.在1992年中,由于一部分经济舱被商务舱取代,导致客流量大幅减少。1991年下半年客流量...

2019-07-27 17:58:48 4143

原创 Python Set intersection() 方法在数据分析的应用

1、首先进行方法介绍1.1、描述intersection() 方法用于返回两个或更多集合中都包含的元素,即交集。1.2、语法intersection() 方法语法:set.intersection(set1, set2 ... etc)1.3、参数set1 – 必需,要查找相同元素的集合set2 – 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开1.4、返回值...

2019-07-23 19:32:17 774

原创 Pandas删除/选取含有特定数值的行或列

Pandas是数据科学中的利器,你可能想到的数据处理骚操作,貌似用Pandas都能够实现,下面这部分在数据处理中往往用于删除异常值,或许还有其他用处,希望读者能够发现。删除/选取某列含有特殊数值的行删除/选取某行含有特殊数值的列...

2019-07-21 19:26:32 11756

原创 特征工程-------绘制特征图

方式一:利用xgboost进行训练模型,可以得出各个特征的重要性评分。方式二:绘制皮卡尔相关系数图,找出各个特征之间的相关性

2019-07-20 09:42:25 995

原创 数据处理过程中对于一列数据内容进行统一的分割为多列的操作

数据处理过程中对于一列数据内容进行统一的分割为多列的操作由于 本人翻了好久,才想出来的办法,很多博客上只介绍了方法一,其实方法二往往更加强大,适用的场景更大。方法一:利用python的split函数进行分割:使用split利用数据中的规则标识符进行分割,如图所示:方法二:切片法:当我们找不到统一规则的时候就要进行统一的切片操作,当然,我自认为这是最方便的,在特征工程的构建中也是经常用到...

2019-07-17 20:39:04 1185

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除