![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
sisteryaya
机器学习,数据挖掘爱好者
展开
-
ubuntu中Python2和python3—pip问题
ubuntu、python、pip原创 2017-10-10 16:41:59 · 7439 阅读 · 0 评论 -
结合Scikit-learn介绍几种常用的特征选择方法
原文链接:https://blog.csdn.net/bryan__/article/details/51607215感谢作者!特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解...转载 2018-05-05 22:57:32 · 658 阅读 · 0 评论 -
table 和 pivot_table
透视表在处理时序问题上很方便,处理完后可转换为常规table,便于统计。举例说明: class_id dates sale_num0 1001 20150101 31 1001 20150102 62 1001 20150103 7...In[]:data = pd.pivot_table...原创 2017-11-27 15:17:04 · 581 阅读 · 0 评论 -
使用sklearn做单机特征工程
原文链接:http://www.cnblogs.com/jasonfreak/p/5448385.html感谢作者分享!使用sklearn做单机特征工程目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据...转载 2018-04-14 10:03:17 · 229 阅读 · 0 评论 -
使用sklearn优雅地进行数据挖掘
原文链接:http://www.cnblogs.com/jasonfreak/p/5448462.html在此感谢读者。目录1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术2 并行处理 2.1 整体并行处理 2.2 部分并行处理3 流水线处理4 自动化调参5 持久化6 回顾7 总结8 参考资料1 使用sklearn进行数据挖掘1.1 数据挖掘...转载 2018-04-13 16:46:43 · 166 阅读 · 0 评论 -
python版本和库链接,错误集合
python库:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboostanaconda版本:https://repo.continuum.io/archive/1、python3.5/3.6安装pyltp报与microsoft相关错误,pip默认安装的是0.2.0版本,改为:pip install pyltp==0.1.9.1即可。2、安装xgboo...原创 2018-03-15 14:02:09 · 186 阅读 · 0 评论 -
读写 CSV 、pickle文件
读写、分块读写CSV文件;pickle原创 2017-08-08 15:14:32 · 1949 阅读 · 0 评论 -
pandas 日期处理
1、时间字符串,提取日期、小时 USER_ID SHOP_ID TIME_STA DATE HOUR0 22127870 1862 2015-12-25 17:00:00 2015-12-25 171 3434231 1862 2016-10-05 11:00:00 2016-10-05 11df['...原创 2017-11-15 18:03:28 · 7488 阅读 · 1 评论 -
要疯了之Matplotlib画图
1、画布颜色def drawn_fig( st, groupby_names , count_name,m,n): st = st.groupby([ groupby_names ])[count_name].mean().reset_index() #画布大小,外围颜色 plt.figure(figsize=(m,n),facecolor='white')...原创 2019-03-19 23:19:05 · 155 阅读 · 0 评论