- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 scikit-learn决策树算法类库使用小结及可视化方法
1.scikit-learn决策树算法类库介绍 scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对应的是DecisionTreeRegre...
2018-01-05 12:26:00 147
原创 信息熵、信息增益、条件熵基本概念及联系
1、 信息熵:H(X) 描述X携带的信息量。 信息量越大(值变化越多),则越不确定,越不容易被预测。 对于抛硬币问题,每次有2种情况,信息熵为1 对于投骰子问题,每次有6中情况,信息熵为1.75 下面为公式: ...
2018-01-03 22:28:00 984
原创 线性时间排序总结
计数排序 计数排序(counting sort)的思路很简单,就是确定比x小的数有多少个。加入有10个,那么x就排在第11位。 严谨来讲,在计算机科学中,计数排序是一个根据比较键值大小的排序算法,它也是一个整数排序算法。它通过比较对象的数值来操作,并通过这些计数来确定它们在即将输出的序列...
2018-01-03 17:05:00 181
原创 算法导论:快速排序优化算法!
常见快速排序:时间复杂度最好情况下O(nlgn),最坏情况O(n2) 快速排序是基于分治模式的: 分解:数组A【p..r】被划分成两个(可能空)子数组A【p..q-1】和A【q+1..r】,使得A【p..q-1】中的每个元素都小于等于A(q),而且,小于等于A【q+1..r】中的元素。下 ...
2018-01-03 16:43:00 163
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人