![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 67
free youreself
这个作者很懒,什么都没留下…
展开
-
时间序列预测 相关比赛和网站
(仅用于个人记录,待学习…)原创 2022-06-20 01:03:27 · 402 阅读 · 1 评论 -
Hive sql : 查询连续登录天数
查询连续登录天数1.问题描述2.在Hive中建表3.查询最大连续登录天数1.问题描述目前有两列数据,分别是用户ID和用户登录的时间,现需要统计用户连续登录的最大天数,中间如有断开,则不算连续,如下图示例。2.在Hive中建表在Hive中进行操作,首先启动Hadoop集群环境,进入到Hadoop安装目录,sbin/start-dfs.sh ,jps查看Hadoop集群有无正常启动正常启动后,输入hive启动hive。使用之前建立的test数据库,没有可以自行创建一个数据库,在test数据库下新原创 2021-01-26 09:59:02 · 1858 阅读 · 0 评论 -
python之信贷风险数据分析及逻辑回归预测,sklearn特征工程
最近看的一些风险信贷相关的一些写的比较详细的博客,还有使用sklearn进行特征工程的博客,单纯的进行简单整理和记录,详细的可以点击链接。文章目录1.Python案例分析之客户信贷预测模型2.利用LendingClub数据建模3.使用sklearn做特征工程1.Python案例分析之客户信贷预测模型来自 https://blog.csdn.net/weixin_43656359/article/details/104683553文章发布于2020-3-14该网页中内容主要介绍了客户信贷预测的一般流原创 2020-08-19 22:39:54 · 2457 阅读 · 0 评论 -
python数据分析基本语法:数据类型转换,pandas分组,级联合并操作等
文章目录1.删除无用的列2.数据类型转换成时间序列类型3.将某列做为原始数据的行索引4.定位条件5.计算滚动均值6.pandas分组7.pandas处理空值8.pandas处理重复值9.pandas处理异常值10.python生成日历11.pandas级联操作12.pandas合并操作13.pandas数据排序14.pandas生成随机数15.pandas替换操作16.pandas映射操作17.python透视表18.pandas交叉表1.删除无用的列df.drop(labels='列名',axis=1原创 2020-05-31 13:25:34 · 474 阅读 · 0 评论