机器学习
kaikai_sk
我的个人主页:https://kaikai-sk.github.io/
爱生活/爱技术
Public:
(1) https://past.date-conference.com/proceedings-archive/2022/html/0878.html
【证书】
软件设计师(软考中级)
展开
-
常用的公式化表达
1 投票原创 2020-04-24 17:04:40 · 330 阅读 · 0 评论 -
java语言调用weka
简单列举几个demo,详细代码见: http://download.csdn.net/detail/kaikai_sk/9827913package callWeka;import java.io.File;import weka.core.Instances;import weka.core.converters.CSVSaver;import weka.core.converters.Co原创 2017-04-27 21:13:06 · 2436 阅读 · 0 评论 -
weka之初窥Instances类
都一个文件并显示package instancesTest;import java.io.FileNotFoundException;import java.io.FileReader;import weka.core.Instances;public class InstancesTest { public static Instances getFileInstances(Strin原创 2017-05-21 20:17:28 · 1686 阅读 · 0 评论 -
weka之ID3
@Override public void buildClassifier(Instances data) throws Exception { //检验算法能否直接处理数据 getCapabilities().testWithFail(data); //删除带有缺失class标记的数据 data=new Instanc原创 2017-05-21 23:24:38 · 1033 阅读 · 0 评论 -
python之决策树
《集体智慧编程》第七章#-*- coding:utf-8 -*-from PIL import Image,ImageDrawmy_data=[['slashdot','USA','yes',18,'None'], ['google','France','yes',23,'Premium'], ['digg','USA','yes',24,'Basic'],原创 2017-05-22 17:13:33 · 467 阅读 · 0 评论 -
weka源码之C45(J48)
一 基本数据结构 (1)Instances对象 一个Instances代表一张表,可以对应一个arff文件或者是一个csv文件,通过Instances对象可以取某一列的均值方差等,主要就是若干行记录的一个封装。 (2)Instance 一个Instance代表一行记录,换言之一个Instances的数据包含多个Instance。每个Instance会有一个特殊的列ClassIndex,该列值转载 2017-06-03 21:10:36 · 950 阅读 · 0 评论 -
神经网络Version1
% A demo to BP nerual networkformat long% define the sigmoid functionf = @(x) 1/(1+exp(-x));% enter the learning rateEta = 0.5;x=[0.05,0.10];y=[0.01,0.99];b=[1,1];bw=[0.35,0.6];temp = size(x); %原创 2017-09-23 17:38:25 · 199 阅读 · 0 评论 -
神经网络Version2
% A demo to BP nerual networkformat long% define the sigmoid functionf = @(x) 1/(1+exp(-x));% enter the learning rateEta = 0.5;x=[0.05,0.10];y=[0.01,0.99];% modifiedb=[1,1,1];bw=[0.35,0.6,0.35];原创 2017-09-26 20:17:13 · 212 阅读 · 0 评论 -
机器学习之weka简介(一)
机器学习之weka简介(一)原创 2018-01-19 22:51:10 · 2325 阅读 · 0 评论 -
机器学习之Friedman检验
具体介绍见西瓜书#include <iostream>#include <cmath>using namespace std;//数据集个数 N//算法个数 k//第i个算法的平均序数值 ridouble calcTX2(int N,int k,double ri[]){ double partone=(12.0*N)/(double)(k*...原创 2018-02-23 13:20:25 · 15606 阅读 · 0 评论 -
pandas 常用操作
DataFrame的样子年龄 性别 手机号 0 2 男 NaN1 3 女 NaN2 4 NaN NaN删除常量属性# remove more constant columns(anyone have a fast ...原创 2018-07-01 15:36:20 · 330 阅读 · 0 评论 -
时间序列的数据
Types of time series dataBefore talking about the imputation methods, let’s classify the time series data according to the composition. If we decomposite the time series data with linear regression...原创 2018-08-20 21:27:53 · 967 阅读 · 0 评论 -
一些可视化的骚图
箱形图小提琴图 * 描述 小提琴图 (Violin Plot) 用于显示数据分布及其概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中位数。箱形图在数据显示方面受到限制,简单的设计往往隐藏了有关数据分布的重要细节。例如使用箱形图时,我们不能了解数据分布是双模还是多模。虽...原创 2018-09-05 19:22:53 · 13860 阅读 · 0 评论 -
Tensorflow入门
占位符"""理解placeholder"""import tensorflow as tfinput1 = tf.placeholder(tf.float32)input2 = tf.placeholder(tf.float32)output = tf.multiply(input1,input2)with tf.Session() as sess: print(se...原创 2018-09-26 22:02:13 · 127 阅读 · 0 评论 -
机器学习常见问题
缺失值由于调查、编码和录入误差,数据中可能存在一些无效值和缺失值,需要给予适当的处理。常用的处理方法有:估算,整例删除,变量删除和成对删除。估算(estimation)。最简单的办法就是用某个变量的样本均值、中位数或众数代替无效值和缺失值。这种办法简单,但没有充分考虑数据中已有的信息,误差可能较大。另一种办法就是根据调查对象对其他问题的答案,通过变量之间的相关分析或逻辑推论进行估计。例如,某一...原创 2018-10-14 22:46:24 · 161 阅读 · 0 评论 -
pandas之重排分级数据到整数索引
# coding: utf-8import sys; print('Python %s on %s' % (sys.version, sys.platform))sys.path.extend(['F:\\c++\\callGBDT', 'F:/c++/callGBDT'])get_ipython().magic(u'save d:/log.txt')get_ipython().magic(u原创 2017-05-18 17:01:43 · 1546 阅读 · 2 评论 -
pandas之汇总和计算描述统计到层次化索引
df=DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])dfdf.sum()df.sum(axis=1)dfdf.sum(axis=1,skipna=False)dfdf.idxmax()dfdf.cumsum()原创 2017-05-18 15:52:56 · 1605 阅读 · 0 评论 -
weka之调用特征选择
参考文献 http://download.csdn.net/detail/kaikai_sk/9854774package FilterTest;import java.io.FileNotFoundException;import java.io.FileReader;import java.util.Random;import weka.attributeSelection.CfsSubs原创 2017-05-28 13:41:51 · 4068 阅读 · 0 评论 -
机器学习之什么是机器学习
机器学习之什么是机器学习原创 2016-10-28 19:53:56 · 695 阅读 · 2 评论 -
机器学习之基本模式
机器学习之基本模式原创 2016-10-28 20:55:38 · 571 阅读 · 0 评论 -
机器学习之与其他学科间的关系
机器学习之与其他学科间的关系原创 2016-10-28 21:11:31 · 898 阅读 · 0 评论 -
机器学习之hypothesis具体是什么样的??
机器学习之hypothesis具体是什么样的??原创 2016-10-29 10:34:06 · 3049 阅读 · 0 评论 -
机器学习之Perceptron Learning Algorithm
机器学习之Perceptron Learning Algorithm原创 2016-10-29 11:32:38 · 576 阅读 · 0 评论 -
机器学习之关联规则
机器学习之关联规则原创 2016-11-11 22:17:37 · 901 阅读 · 0 评论 -
方差的分母是n还是n-1?????????
方差的分母是n还是n-1?????????转载 2017-03-16 20:13:58 · 3536 阅读 · 0 评论 -
机器学习之分位数
分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值。如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;八等分就是八分位数等。四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数。四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位原创 2017-05-22 22:03:53 · 1846 阅读 · 0 评论 -
weka之ZeroR
http://www.cnblogs.com/7899-89/p/3630193.html构造分类器函数 @Override public void buildClassifier(Instances instances) throws Exception { //判断算法能否处理种种类型的数据 getCapabilities().testW原创 2017-05-23 18:28:17 · 2219 阅读 · 0 评论 -
统计之三σ原则
统计之三σ原则原创 2017-05-26 20:07:57 · 4350 阅读 · 0 评论 -
weka之NB算法
@Override public void buildClassifier(Instances data) throws Exception { //检测分类器能否处理数据 getCapabilities().testWithFail(data); //删除具有类别缺失值的实例 data=new Instances(d原创 2017-05-08 14:06:07 · 1167 阅读 · 0 评论 -
weka之对id3实现可视化
参照J48,添加两个变量 /*the node's id*/ private int m_id; //static count to assign the ids private static int ms_count=0;添加构造函数 public Id3Visualise() { m_id=ms_count++; }继承Drawable接口原创 2017-05-08 17:26:50 · 1915 阅读 · 0 评论 -
pandas之索引、选取和过滤
《利用python进行数据分析》相应章节obj=Series(np.arange(4.),index=['a','b','c','d'])from pandas import *import pandas as pdobj=Series(np.arange(4.),index=['a','b','c','d'])objobj['b']obj[1]obj[2:4]obj[['b','a原创 2017-05-17 13:39:29 · 1678 阅读 · 0 评论 -
pandas之算数运算和数据对齐--带有重复值的轴索引
s1=Series([7.3,-2.5,3.4,1.5],index=['a','c','d','e'])s2=Series([-2.1,3.6,-1.5,4,3.1],index=['a','c','e','f','g'])s1s2s1+ss1+s2df1=DataFrame(np.arange(9.).reshape((3,3)),columns=list('bcd'),index=原创 2017-05-17 16:13:09 · 969 阅读 · 0 评论 -
weka之Evaluation类
参考文献: http://download.csdn.net/detail/kaikai_sk/9854749package EvaluationTest;import java.io.FileNotFoundException;import java.io.FileReader;import java.util.Random;import weka.classifiers.Evaluatio原创 2017-05-28 11:06:02 · 1252 阅读 · 0 评论 -
数据挖掘之主要方法简介
数据挖掘之主要方法简介原创 2016-11-04 11:47:23 · 333 阅读 · 0 评论