利用weka和Python学习机器学习
文章平均质量分 62
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
kaikai_sk
我的个人主页:https://kaikai-sk.github.io/
爱生活/爱技术
Public:
(1) https://past.date-conference.com/proceedings-archive/2022/html/0878.html
【证书】
软件设计师(软考中级)
展开
-
机器学习之weka简介(一)
机器学习之weka简介(一)原创 2018-01-19 22:51:10 · 2325 阅读 · 0 评论 -
Weka算法Classifier-trees-RandomTree源码分析
一、RandomTree算法原创 2014-09-14 21:20:10 · 7570 阅读 · 0 评论 -
Weka算法Classifier-tree-RandomForest源码分析(一)算法
Weka算法Classifier-tree-RandomForest源码分析(一)算法原创 2014-09-08 20:41:02 · 9839 阅读 · 1 评论 -
Weka算法Classifier-meta-AdditiveRegression源码分析
Weka算法Classifier-meta-AdditiveRegression源码分析原创 2014-10-26 21:58:33 · 5817 阅读 · 2 评论 -
Weka算法Classifier-tree-J48源码分析(二)ClassifierTree
Weka算法Classifier-tree-J48源码分析(二)ClassifierTree原创 2014-09-07 15:43:15 · 5868 阅读 · 1 评论 -
weka之ZeroR
http://www.cnblogs.com/7899-89/p/3630193.html构造分类器函数 @Override public void buildClassifier(Instances instances) throws Exception { //判断算法能否处理种种类型的数据 getCapabilities().testW原创 2017-05-23 18:28:17 · 2219 阅读 · 0 评论 -
统计之三σ原则
统计之三σ原则原创 2017-05-26 20:07:57 · 4345 阅读 · 0 评论 -
weka之Evaluation类
参考文献: http://download.csdn.net/detail/kaikai_sk/9854749package EvaluationTest;import java.io.FileNotFoundException;import java.io.FileReader;import java.util.Random;import weka.classifiers.Evaluatio原创 2017-05-28 11:06:02 · 1252 阅读 · 0 评论 -
机器学习之什么是机器学习
机器学习之什么是机器学习原创 2016-10-28 19:53:56 · 695 阅读 · 2 评论 -
机器学习之基本模式
机器学习之基本模式原创 2016-10-28 20:55:38 · 571 阅读 · 0 评论 -
机器学习之与其他学科间的关系
机器学习之与其他学科间的关系原创 2016-10-28 21:11:31 · 898 阅读 · 0 评论 -
机器学习之hypothesis具体是什么样的??
机器学习之hypothesis具体是什么样的??原创 2016-10-29 10:34:06 · 3043 阅读 · 0 评论 -
机器学习之Perceptron Learning Algorithm
机器学习之Perceptron Learning Algorithm原创 2016-10-29 11:32:38 · 576 阅读 · 0 评论 -
数据挖掘之主要方法简介
数据挖掘之主要方法简介原创 2016-11-04 11:47:23 · 333 阅读 · 0 评论 -
机器学习之关联规则
机器学习之关联规则原创 2016-11-11 22:17:37 · 900 阅读 · 0 评论 -
方差的分母是n还是n-1?????????
方差的分母是n还是n-1?????????转载 2017-03-16 20:13:58 · 3535 阅读 · 0 评论 -
java语言调用weka
简单列举几个demo,详细代码见: http://download.csdn.net/detail/kaikai_sk/9827913package callWeka;import java.io.File;import weka.core.Instances;import weka.core.converters.CSVSaver;import weka.core.converters.Co原创 2017-04-27 21:13:06 · 2436 阅读 · 0 评论 -
weka之NB算法
@Override public void buildClassifier(Instances data) throws Exception { //检测分类器能否处理数据 getCapabilities().testWithFail(data); //删除具有类别缺失值的实例 data=new Instances(d原创 2017-05-08 14:06:07 · 1167 阅读 · 0 评论 -
weka之对id3实现可视化
参照J48,添加两个变量 /*the node's id*/ private int m_id; //static count to assign the ids private static int ms_count=0;添加构造函数 public Id3Visualise() { m_id=ms_count++; }继承Drawable接口原创 2017-05-08 17:26:50 · 1915 阅读 · 0 评论 -
pandas之索引、选取和过滤
《利用python进行数据分析》相应章节obj=Series(np.arange(4.),index=['a','b','c','d'])from pandas import *import pandas as pdobj=Series(np.arange(4.),index=['a','b','c','d'])objobj['b']obj[1]obj[2:4]obj[['b','a原创 2017-05-17 13:39:29 · 1677 阅读 · 0 评论 -
pandas之算数运算和数据对齐--带有重复值的轴索引
s1=Series([7.3,-2.5,3.4,1.5],index=['a','c','d','e'])s2=Series([-2.1,3.6,-1.5,4,3.1],index=['a','c','e','f','g'])s1s2s1+ss1+s2df1=DataFrame(np.arange(9.).reshape((3,3)),columns=list('bcd'),index=原创 2017-05-17 16:13:09 · 969 阅读 · 0 评论 -
pandas之汇总和计算描述统计到层次化索引
df=DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])dfdf.sum()df.sum(axis=1)dfdf.sum(axis=1,skipna=False)dfdf.idxmax()dfdf.cumsum()原创 2017-05-18 15:52:56 · 1605 阅读 · 0 评论 -
pandas之重排分级数据到整数索引
# coding: utf-8import sys; print('Python %s on %s' % (sys.version, sys.platform))sys.path.extend(['F:\\c++\\callGBDT', 'F:/c++/callGBDT'])get_ipython().magic(u'save d:/log.txt')get_ipython().magic(u原创 2017-05-18 17:01:43 · 1546 阅读 · 2 评论 -
weka之初窥Instances类
都一个文件并显示package instancesTest;import java.io.FileNotFoundException;import java.io.FileReader;import weka.core.Instances;public class InstancesTest { public static Instances getFileInstances(Strin原创 2017-05-21 20:17:28 · 1685 阅读 · 0 评论 -
weka之ID3
@Override public void buildClassifier(Instances data) throws Exception { //检验算法能否直接处理数据 getCapabilities().testWithFail(data); //删除带有缺失class标记的数据 data=new Instanc原创 2017-05-21 23:24:38 · 1033 阅读 · 0 评论 -
python之决策树
《集体智慧编程》第七章#-*- coding:utf-8 -*-from PIL import Image,ImageDrawmy_data=[['slashdot','USA','yes',18,'None'], ['google','France','yes',23,'Premium'], ['digg','USA','yes',24,'Basic'],原创 2017-05-22 17:13:33 · 467 阅读 · 0 评论 -
机器学习之分位数
分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值。如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;八等分就是八分位数等。四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数。四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位原创 2017-05-22 22:03:53 · 1841 阅读 · 0 评论