![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Code经验积累
方不正圆
努力学习中。。。
展开
-
pandas 查看属性列的重复特性,
#该方法只能用于非数值型属性,如果要判断数值型,可以先暂时转换为str类型df.describe(include=['O'])unique为不重复的个数,如有值[‘A’,‘B’,‘A’,‘C’]4个值,其unique=3。devIp,devName等所有值都是重复的,对分析无用,可以去掉。df=df.drop(['devIp','devName','devFstType','devSn...原创 2018-10-28 16:03:42 · 1639 阅读 · 0 评论 -
Python 将Unix时间戳转化为通用时间(年,天,时,分)。处理Dataframe中的Unix时间戳
import time def time_transform(unix_time): tt = {} #利用字典存储 t = time.gmtime(unix_time)#重要的是这个函数,可获得更多的信息。这里只取其中4个 day = t.tm_mday hour = t.tm_hour min = t.tm_min #这里min...原创 2018-10-27 15:51:20 · 1062 阅读 · 0 评论 -
数据分析 kaggle 天池 竞赛常用函数整理
// 显示数据的缺失程度def miss_value_table(df): mis_val = df.isnull().sum() mis_val_percent = 100*(mis_val/len(df)) mis_val_t = pd.concat([mis_val,mis_val_percent],axis=1) mis_val_table = mis_v...原创 2019-02-16 16:45:41 · 937 阅读 · 0 评论 -
算法编程方法总结
动态规划1、通常用数组表示,且通常从后往前思考,编程从前往后迭代实现,如两个字符串的匹配2、写出边界函数,递归规律原创 2019-03-20 16:55:55 · 367 阅读 · 0 评论