- 博客(3)
- 收藏
- 关注
原创 利用gridsearchcv进行交叉验证参数调优实战
用sklearn包进行机器学习是一件很舒服的事情,以往写一页的代码,用sklearn的一个参数就搞定,多么酸爽。然而由于包是人家的,所以参数设置什么的咱们是被动的。只有好好读官方文档才能搞清楚每个参数的意义是什么,这是调参前的重要武装。大家都知道sklearn调参有一个核武器---gridsearchcv,它存在的意义就是自动调参,只要把参数输进去,人家乖乖地就把最优化的结果和参数跑了出来。然
2016-09-03 01:39:41 11416
原创 ImportError: DLL load failed:找不到指定的模块 解决方案
之前在linux的matplotlib突然出现问题,重新安装也没有解决,于是转战windows把当前的项目写完再说。没想到windows的canopy里没有自带sklearn包。好吧,那去官方github下一个放文件里吧。兴冲冲地下过来放进去后,import sklearn没有问题,太好了,再来一句。from sklearn.ensemble.forest import RandomForestR
2016-09-02 18:00:13 93607 17
原创 简单介绍树回归的算法原理
线性回归方法可以有效的拟合所有样本点(局部加权线性回归除外)。当数据拥有众多特征并且特征之间关系十分复杂时,构建全局模型的想法一个是困难一个是笨拙。此外,实际中很多问题为非线性的,例如常见到的分段函数,不可能用全局线性模型来进行拟合。 树回归将数据集切分成多份易建模的数据,然后利用线性回归进行建模和拟合。构建回归树算法伪代码:寻找当前最佳待切特征和特征值并
2016-09-01 16:22:09 6940 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人