- 博客(9)
- 资源 (3)
- 收藏
- 关注
转载 python中去掉空格项目
版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]在人工采集数据时,经常有可能把空值和空格混在一起,一般也注意不到在本来为空的单元格里加入了空格。这就给做数据处理的人带来了麻烦,因为空值和空格都是代表的无数据,而pandas中Series的方法notnull()会把有空格的数据也纳入进来,这样就不能完整地得到我们想要的数据了,这里给
2016-12-31 20:07:43 2395
转载 linux下pip安装的几种方式
pip安装以及好用的pip镜像源标签: pythonpip2014-03-24 17:10 1552人阅读 评论(0)收藏举报分类: python(14) 版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]安装方式1[python] view plain copy p
2016-12-30 23:47:39 74047 5
转载 xgboost 特征工程
Xgboost在各大数据挖掘比赛中是一个大杀器,往往可以取得比其他各种机器学习算法更好的效果。数据预处理,特征工程,调参对Xgboost的效果有着非常重要的影响。这里介绍一下运用xgboost的特征选择,运用xgboost的特征选择可以筛选出更加有效的特征代入Xgboost模型。这里采用的数据集来自于Kaggle | Allstate Claims Severity比赛,这里的
2016-12-15 17:57:28 4032
转载 xgboost优化
译注:文内提供的代码和运行结果有一定差异,可以从这里下载完整代码对照参考。另外,我自己跟着教程做的时候,发现我的库无法解析字符串类型的特征,所以只用其中一部分特征做的,具体数值跟文章中不一样,反而可以帮助理解文章。所以大家其实也可以小小修改一下代码,不一定要完全跟着教程做~ ^0^需要提前安装好的库:numpy,matplotlib,pandas,xgboost,scikit-learn
2016-12-15 17:55:24 2809
转载 oracle时间相减
oracle 两个时间相减默认的是天数Oracle 两个时间相减默认的是天数*24 为相差的小时数oracle 两个时间相减默认的是天数*24*60 为相差的分钟数oracle 两个时间相减默认的是天数*24*60*60 为相差的秒数--MONTHS_BETWEEN(date2,date1) 给出date2-date1的月份 SQL> select months_bet
2016-12-15 12:05:26 1002
转载 xgboost特征工程
Xgboost在各大数据挖掘比赛中是一个大杀器,往往可以取得比其他各种机器学习算法更好的效果。数据预处理,特征工程,调参对Xgboost的效果有着非常重要的影响。这里介绍一下运用xgboost的特征选择,运用xgboost的特征选择可以筛选出更加有效的特征代入Xgboost模型。这里采用的数据集来自于Kaggle | Allstate Claims Severity比赛,这里的
2016-12-15 12:02:52 6831
转载 python类型转换
使用astype实现dataframe字段类型转换# -*- coding: UTF-8 -*-import pandas as pddf = pd.DataFrame([{'col1':'a', 'col2':'1'}, {'col1':'b', 'col2':'2'}])print df.dtypesdf['col2'] = df['col2'].astype('int')p
2016-12-07 17:51:37 13895
转载 xgboost
版权声明:如需转载,请注明出处http://blog.csdn.net/a819825294目录(?)[+]1.背景关于xgboost的原理网络上的资源很少,大多数还停留在应用层面,本文通过学习陈天奇博士的PPT 地址和xgboost导读和实战 地址,希望对xgboost原理进行深入理解。2.xgboost vs gbdt说到xgbo
2016-12-06 15:48:03 1351
转载 量化交易
http://www.newsmth.NET/nForum/#!article/Python/128763最近程序化交易很热,量化也是我很感兴趣的一块。 国内量化交易的平台有几家,我个人比较喜欢用的是JoinQuant,里面有篇干货贴分享给大家,希望对各位有帮助。 =========================== 量化交易策略
2016-12-04 20:48:38 1552
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人