工作中遇到的问题
sisteryaya
机器学习,数据挖掘爱好者
展开
-
工作中遇到的问题3:seaborn画图,特征重要性,洗牌(重组),代码运行时间
1、画图import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline #para_list为字段名,train为数据集,'label'为标签:0,1(观察0,1数据的分布) for para in paraz_list: fac...原创 2018-03-15 14:32:09 · 991 阅读 · 0 评论 -
工作中遇到的问题2:双层for循环不敌dict
问题1衍生出来的,有一个字段‘update_time’,从小到大排序,10分钟为一个mark。之前的做法是,先求得最大时间和最小时间之间有多少个10分钟,以十分钟十分钟的存入一个list,外层遍历‘update_time’,内层用每个time去list里面比较,取出索引值,具体如下: df = df.sort_values('update_time', ascending=True) # ...原创 2018-03-07 16:00:52 · 327 阅读 · 0 评论 -
工作中遇到的问题1:空值与空字符串
一份数据,在服务器上是空字符串,导入本地后是空值,所以在处理时报了错。服务器上,读入文件后,将空字符串转换为空值即可,data.replace('',np.NaN),若不需要空值,可用dropna剔除。总结:出现问题时,得究其根本。...原创 2018-03-05 10:05:59 · 657 阅读 · 0 评论