- 博客(20)
- 资源 (43)
- 问答 (1)
- 收藏
- 关注
原创 读论文
SBFS:基于搜索的软件缺陷预测特征选择框架 SMOTE+遗传算法做属性选择数据挖掘中属性选择算法的分析与研究_郭维维 科普 weka中属性选择
2017-05-30 11:29:38 324
原创 weka之调用特征选择
参考文献 http://download.csdn.net/detail/kaikai_sk/9854774package FilterTest;import java.io.FileNotFoundException;import java.io.FileReader;import java.util.Random;import weka.attributeSelection.CfsSubs
2017-05-28 13:41:51 4068
原创 weka之Evaluation类
参考文献: http://download.csdn.net/detail/kaikai_sk/9854749package EvaluationTest;import java.io.FileNotFoundException;import java.io.FileReader;import java.util.Random;import weka.classifiers.Evaluatio
2017-05-28 11:06:02 1252
原创 java之System.arraycopy()
原文address: http://blog.csdn.net/e421083458/article/details/8839242import java.util.Arrays;public class LessionSystemArraycopy { public static void main(String[] args) { int[] ids={1,2,
2017-05-26 21:50:51 751
原创 weka之ZeroR
http://www.cnblogs.com/7899-89/p/3630193.html构造分类器函数 @Override public void buildClassifier(Instances instances) throws Exception { //判断算法能否处理种种类型的数据 getCapabilities().testW
2017-05-23 18:28:17 2219
原创 python之读写excel文件
读import xlrddef open_excel(file= 'file.xls'): try: data = xlrd.open_workbook(file) return data except Exception,e: print str(e)#根据索引获取Excel表格中的数据#参数:file:Excel文件路径 col
2017-05-23 16:44:11 333
原创 机器学习之分位数
分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值。如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;八等分就是八分位数等。四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数。四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位
2017-05-22 22:03:53 1844
原创 python之决策树
《集体智慧编程》第七章#-*- coding:utf-8 -*-from PIL import Image,ImageDrawmy_data=[['slashdot','USA','yes',18,'None'], ['google','France','yes',23,'Premium'], ['digg','USA','yes',24,'Basic'],
2017-05-22 17:13:33 467
原创 weka之ID3
@Override public void buildClassifier(Instances data) throws Exception { //检验算法能否直接处理数据 getCapabilities().testWithFail(data); //删除带有缺失class标记的数据 data=new Instanc
2017-05-21 23:24:38 1033
原创 weka之初窥Instances类
都一个文件并显示package instancesTest;import java.io.FileNotFoundException;import java.io.FileReader;import weka.core.Instances;public class InstancesTest { public static Instances getFileInstances(Strin
2017-05-21 20:17:28 1685
原创 pandas之重排分级数据到整数索引
# coding: utf-8import sys; print('Python %s on %s' % (sys.version, sys.platform))sys.path.extend(['F:\\c++\\callGBDT', 'F:/c++/callGBDT'])get_ipython().magic(u'save d:/log.txt')get_ipython().magic(u
2017-05-18 17:01:43 1546 2
原创 pandas之汇总和计算描述统计到层次化索引
df=DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])dfdf.sum()df.sum(axis=1)dfdf.sum(axis=1,skipna=False)dfdf.idxmax()dfdf.cumsum()
2017-05-18 15:52:56 1605
转载 mysql字符串函数CONCAT_WS与CONCAT()用法
CONCAT(str1,str2,…) 方法 CONCAT(str1,str2,…) 说明 返回结果为连接参数产生的字符串。如有任何一个参数为NULL ,则返回值为 NULL。如果所有参数均为非二进制字符串,则结果为非二进制字符串。 如果自变量中含有任一二进制字符串,则结果为一个二进制字符串。一个数字参数被转化为与之相等的二进制字符串格式;若要避免这种情况,可使用显式类型 cast,
2017-05-17 20:16:22 11008
原创 pandas之算数运算和数据对齐--带有重复值的轴索引
s1=Series([7.3,-2.5,3.4,1.5],index=['a','c','d','e'])s2=Series([-2.1,3.6,-1.5,4,3.1],index=['a','c','e','f','g'])s1s2s1+ss1+s2df1=DataFrame(np.arange(9.).reshape((3,3)),columns=list('bcd'),index=
2017-05-17 16:13:09 969
原创 pandas之索引、选取和过滤
《利用python进行数据分析》相应章节obj=Series(np.arange(4.),index=['a','b','c','d'])from pandas import *import pandas as pdobj=Series(np.arange(4.),index=['a','b','c','d'])objobj['b']obj[1]obj[2:4]obj[['b','a
2017-05-17 13:39:29 1678
原创 python语言之enumerate
#-*- coding:utf-8 -*-if __name__=='__main__': #惯用法 names=['Alice','Bob','Cindy'] for index,element in enumerate(names): print '%d, %s'%(index,element) #新手用法 index=0 whi
2017-05-12 18:38:09 324
原创 weka之对id3实现可视化
参照J48,添加两个变量 /*the node's id*/ private int m_id; //static count to assign the ids private static int ms_count=0;添加构造函数 public Id3Visualise() { m_id=ms_count++; }继承Drawable接口
2017-05-08 17:26:50 1915
原创 weka之NB算法
@Override public void buildClassifier(Instances data) throws Exception { //检测分类器能否处理数据 getCapabilities().testWithFail(data); //删除具有类别缺失值的实例 data=new Instances(d
2017-05-08 14:06:07 1167
ID3源码分析
2017-05-21
java调用weka
2017-04-27
jsp之一个简单的计算器
2016-11-05
操作系统之作业调度
2016-08-09
死锁预防避免检测处理
2016-08-09
谭浩强C语言对应C语言课程PPT.zip
2020-05-26
c#的套接字编程 System.Net.Sockets.SocketException
2016-10-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人