- 博客(9)
- 资源 (7)
- 收藏
- 关注
原创 Python/scikit-learn机器学习库(决策树)
分类 DecisionTreeClassifier可以用于二分类和多分类。 from sklearn.datasets import load_iris from sklearn import tree from sklearn.externals.six import StringIO import pydot iris=load_iris(
2015-11-18 22:12:14 1360
原创 决策树与随机森林算法
决策树(分类树)是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。决策树只需要构建一次,每一次预测分类的最大计算次数不超过决策树的深度。决策树学习算法ID3算法通过自顶向下构造决策树来进行学习,构造过程是从”选取分类能力最好的属性作为根节点被测试”开始,然后为根节点属性的每个可能值产生一个分支。选择合适的分割点,将分类的各个子集都很”纯净”。
2015-11-18 21:33:39 3612
原创 plantomjs&casperjs
Casperjs1.设置编码phantom.outputEncoding = "gbk";2.页面操作querySelector只返回匹配的第一个元素,如果没有匹配项,返回null。querySelectorAll返回匹配的元素集合,如果没有匹配项,返回空的nodelist。返回的结果是静态的,之后document的改变不影响之前取得的结果。这两个方法接收三
2015-11-16 23:20:08 930
原创 Python代码总结
OSos.walk(dirpath)返回一个三元组(dirpath,dirnames,filenames),其中第一个dirpath(string)是搜索目录,第二个dirnames(list)为搜索目录下的所有文件夹,第三个filenames(list)为搜索目录下所有的文件。 for dirpath,dirnames,filenames in os.walk(rootdir):
2015-11-16 15:04:30 1248
原创 Python/scikit-learn机器学习库(特征选取)
去除方差小的特征设置一个方差阈值,没有达到这个方差阈值的特征都会被丢弃。 VarianceThreshold,算法输入只要求特征(X),不需要输入结果(Y)。 from sklearn.feature_selection import VarianceThreshold X=[[feature1,feature2,…],…] sel=VarianceThreshold(th
2015-11-09 21:16:15 18616
原创 Python第三方库代码总结
urllib&urllib2 import urllib.request site=urllib.request.urlopen(url) // //HTTP头信息 site.info() //返回码 site.getcode() //保存文件,返回(filename,mine_hdrs) file=urlli
2015-11-09 14:04:28 959
原创 凸优化
凸优化一旦将一个实际问题转化为凸优化问题,大体上意味着相应问题可以得到彻底解决。 线性规划:目标函数和约束函数都是线性函数, 凸优化: 目标函数和约束函数都是凸函数, 超平面分离定理 假设C和D是两个不想交的凸集,那么存在超平面将两个集合分离。凸函数性质如果函数f是凸函数,那么它的非负伸缩和求和都是凸函数。类似,凹函数的非负伸缩和求和都是凹函数。如果函数f1,f2,…,fm为凸函数
2015-11-09 00:06:58 1378
原创 Python/scikit-learn机器学习库(SVM支持向量机)
SVMSVM用于分类、回归、异常检测。 优点:高维空间有效。维度小于样本数时依然有效。样本少时表现不好。分类多分类: SVC、NuSVC、LinearSVC。SVMs决策函数依赖于训练数据中一部分,这些向量称为支持向量。NuSVC from sklearn.svm import NuSVC clf=svm.NuSVC()SVC from sklearn import
2015-11-03 15:08:14 5444
原创 Python/scikit-learn机器学习库(线性、二次判别分析)
线性判别分析LDA只能学习线性边界,二次判别分析QDA 可以学习二次边界。LDALDA可以将输入的数据降维处理。 import numpy as np from sklearn.lda import LDA X=np.array([[x1,x2,..,xn],…]) Y=np.array([class1,class2,…]) clf=LDA()
2015-11-02 14:02:49 2198 1
linux网络安全技术与实现.pdf
2013-03-15
HTTP协议详解.pdf
2013-03-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人