- 博客(6)
- 收藏
- 关注
原创 求助:Python merge后数据全部为空值nan
问题阐述:如何解决merge后数据全部为nan?A有1000行、2列B有500行、1000列一、左连接df=pd.merge(A,B,on=[id1,id2], how='left')结果df.shape()正常,1000行、1000列。但是数据有998列为空。二、右连接df=pd.merge(A,B,on=[id1,id2], how='right')结果df.s...
2019-10-23 18:57:26 5543
原创 ABTest兴趣点讨论
Brief Introduction and discussion of ABTest with a relatively complete knowledge system under the scenario of evaluating the validity of data source. Key words: ABTest, validity of data source, central limit theorem 评估数据源有效性场景下的ABTest简介与讨论
2019-06-03 20:42:19 308
原创 Xshell操作总结
一、在Xshell里跑数:1、跑SQL文件且包含表头:set hive.cli.print.header=true;hive -f filename.sql |tr "\t" ',' > filename.csv2、跑简短SQL语句:hive -S -e ' set hive.cli.print.header=true;Your sql sentences bl...
2019-04-24 14:29:01 646
转载 收藏-机器学习分类-感觉不错
图中整理了机器学习的各种方法,大体分为监督式学习、半监督式学习、无监督式学习、增强学习、其他五大类,每一类都有很多算法实现。点击查看大图,下面的内容是文字版的整理。编辑 | 数说君一、监督式学习 Supervised Learning 在监督式学习下,每组训练数据都有一个标识值或结果值,如客户流失对应1,不流失对应0。在建立预测模型的时候,监督式学习建立一个学习过程,将预测的结果与训练数据的实际结...
2018-03-21 11:04:43 216
转载 《用Python玩转数据》scikit-learn机器学习经典入门项目
《用Python玩转数据》scikit-learn机器学习经典入门项目scikit-learn是基于NumPy、SciPy和Matplotlib的著名的Python机器学习包,里面包含了大量经典机器学习的数据集和算法实现,请基于经典的鸢尾花数据集iris实现简单的分类和聚类功能。#通过如下语句可以获得iris数据集(通过dir(datasets)查看数据集,例如可用datasets.lo...
2017-10-16 10:06:04 1832
转载 用Python实现BubbleSort
#冒泡排序算法的Python实现L = [7,3,9,2,0,4,1,6,8,5]length = len(L)def bubbleSort(L): if length == 0 or length == 1: return L for i in range(length): for j in range(length-i-1): ...
2017-10-13 18:20:14 2524
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人