- 博客(7)
- 收藏
- 关注
原创 itertools模块中的product方法
itertools.product(*iterables[, repeat])笛卡尔积创建一个迭代器,生成表示item1,item2等中的项目的笛卡尔积的元组,repeat是一个关键字参数,指定重复生成序列的次数。代码示例如下:import itertoolsa = (1, 2, 3)b = ('A', 'B', 'C')c = itertools.product(a,b)for ...
2019-07-30 15:52:20 985
原创 关于在数据建模中python库tqdm的使用
有时候跑循环处理大数据需要很长的时间,维持tqdm可以是一个监控器的作用,形成可视化的进度条,使用起来非常方便。方法一:方法二:
2019-07-30 10:41:33 194
原创 时间序列的基本知识
1、时间图对于时间序列数据而言,我们从最简单的时间图开始。时间图是用将观测值与观测时间点作图,散点之间用直线连接。例如图2.1表示在澳大利亚两个最大的城市之间,Ansett航空公司的每周客流量。例如以下图形:该时间图直观地展现出数据具有的一些特征:由于1989年当地的工业纠纷,当年的客流量为0.在1992年中,由于一部分经济舱被商务舱取代,导致客流量大幅减少。1991年下半年客流量...
2019-07-27 17:58:48 4143
原创 Python Set intersection() 方法在数据分析的应用
1、首先进行方法介绍1.1、描述intersection() 方法用于返回两个或更多集合中都包含的元素,即交集。1.2、语法intersection() 方法语法:set.intersection(set1, set2 ... etc)1.3、参数set1 – 必需,要查找相同元素的集合set2 – 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开1.4、返回值...
2019-07-23 19:32:17 774
原创 Pandas删除/选取含有特定数值的行或列
Pandas是数据科学中的利器,你可能想到的数据处理骚操作,貌似用Pandas都能够实现,下面这部分在数据处理中往往用于删除异常值,或许还有其他用处,希望读者能够发现。删除/选取某列含有特殊数值的行删除/选取某行含有特殊数值的列...
2019-07-21 19:26:32 11756
原创 特征工程-------绘制特征图
方式一:利用xgboost进行训练模型,可以得出各个特征的重要性评分。方式二:绘制皮卡尔相关系数图,找出各个特征之间的相关性
2019-07-20 09:42:25 995
原创 数据处理过程中对于一列数据内容进行统一的分割为多列的操作
数据处理过程中对于一列数据内容进行统一的分割为多列的操作由于 本人翻了好久,才想出来的办法,很多博客上只介绍了方法一,其实方法二往往更加强大,适用的场景更大。方法一:利用python的split函数进行分割:使用split利用数据中的规则标识符进行分割,如图所示:方法二:切片法:当我们找不到统一规则的时候就要进行统一的切片操作,当然,我自认为这是最方便的,在特征工程的构建中也是经常用到...
2019-07-17 20:39:04 1185
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人