- 博客(30)
- 资源 (9)
- 收藏
- 关注
原创 Weka中ROC和AUC通过调用API实现
Weka中实现计算ROC的是ThresholdCurve类的getCurve函数(1)getCurve函数@param 一般是十折交叉得到的predictions @param 正例的类标记,多元分类问题,设置某个类别为正例,其他类别就是负例 @return datapoints if (pred.actual() == classIndex) { totPo...
2018-04-30 22:38:04 2053
原创 Weka中的Evaluation类源代码分析
使用的数据是最简单的weather.nominal.arff,使用的分类模型是NaiveBayes1.在构造函数中进行了如下操作:m_ClassPriors[numClasses]统计构造函数传入的data的各个类的先验概率,有一个平滑处理,在统计之前每个m_ClassPriors[i]都赋值为1,防止出现某个类先验概率为0的情况出现。m_MarginCounts = new doub...
2018-04-30 20:09:39 757
原创 第三章——发现群组
cnblog的订阅源:http://feed.cnblogs.com/blog/sitehome/rss cnblog的首页:https://www.cnblogs.com/ 将两者用浏览器打开后,可以发现有很多的相似之处,订阅源中的每一个entry就对应首页中的一篇博客...
2018-04-27 21:11:52 239
原创 Java内存的相关问题
为什么java获取的最大堆内存和设置的不一致Java 内存溢出(java.lang.OutOfMemoryError)的常见情况和处理方式总结Sublime Text 3 配置java运行环境Java OutOfMemory异常清单 —— 在自己的机器上制造内存溢出...
2018-04-27 16:32:59 130
原创 VisualVM——Java程序监控工具
自从 JDK 6 Update 7 以后已经作为 Oracle JDK 的一部分,位于 JDK 根目录的 bin 文件夹下(jvisualvm.exe),无需安装,直接运行即可。使用SizeOf测定JVM中对象占用内存...
2018-04-27 14:41:11 175
原创 第九章 高阶分类:核方法与SVM
用Bing Map服务代替Yahoo的Geocoding API Bing Map的相关网站: Bing Map 开发者中心 publice21@outlook Bing Map 的MSDN Bing Map 的MSDN 另一个文档 根据Bing Map修改后的部分代码:BingKey="AudmvxyrHM35ktbN5bLBPtVL24Yst22RTfIyRSxzr45r7aY9...
2018-04-27 12:26:45 321
原创 Weka分布式实验
File协议 startRemoteEngine.shjava -Xmx1024m -classpath ../db_drivers/mysql-connector-java-5.1.46.jar;remoteEngine.jar;../weka3.7.13.jar -Djava.security.policy=remote.policy weka.experiment.RemoteE...
2018-04-26 16:39:37 563
原创 Ubuntu安装MySQL
sudo apt-get install mysql-server会提示你设置密码,如果安装时没有设置密码的解决办法参考ubuntu安装mysql 时未提示输入密码udo apt isntall mysql-clientsudo apt install libmysqlclient-dev安装成功后可以通过下面的命令测试是否安装成功:sudo netstat -tap |...
2018-04-26 10:46:42 164
原创 Ubuntu服务器安装桌面
Ubuntu14.04 server 安装桌面从零开始配置Ubuntu Server 14.04 图形界面、Caffe安装及远程连接Ubuntu 16.04 server 图形界面注意最后修改启动项 如何默认不启动桌面,等需要时再启用。 /etc/default/grub GRUB_CMDLINE_LINUX_DEFAULT=”” 改为 “text”,然后upda...
2018-04-25 12:54:34 4897
原创 Xshell5评估期已过
正在使用的xshell 5不能使用,提示xshell 5评估期已过,重新安装还是不行。其实xshell 5有免费版的,即Home & school 版本。卸载原程序,下载安装免费版本的xshell 5即可。免费版本的链接:http://www.netsarang.com/download/free_license.html...
2018-04-25 12:38:08 1477
原创 UCI数据集转化为Arff数据集
以Adult数据集为例 将adult.data.txt文件改为csv格式,用Weka Explorer打开adult.data.csv然后保存为arff文件。 将adult.test.txt文件也作如上操作,会出现错误: |1x3 Cross validator25, Private, 226802, 11th, 7, Never-married, Machine-op-inspc...
2018-04-25 07:38:43 1759
原创 计算机辅助翻译CAT——OmegaT
轻松愉快的辅助翻译工具OmegaT的简单使 OmegaT - 开源跨平台的电脑辅助翻译工具软件入门与下载 (Win/Mac/Linux)
2018-04-18 13:44:56 2015
转载 ROC and AUC
参考: ROC和AUC介绍以及如何计算AUC 多分类下的ROC曲线和AUCROC曲线首先ROC分析的是二元分类模型,也就是输出类别只有两种值的分类模型。对于其他的多类分类模型可以做相应的转换,本文后面再作分析。ROC曲线的特点:ROC曲线的横轴是False postive rate,纵轴是True positive rate一个特定分类模型在一个测试数据集上只会得到一个FP...
2018-04-17 13:23:29 396
原创 本科论文查重
降低重复率的方法(1) 网上的资源都是相互有着关联的,要是直接把原话拿来用是很容易就被检查出来的。可以在写的时候变化一下,换个关键词,用意思相同的词来替换原文中的词语。也可以变一下句子的结构,用自己的话重新改写一下,这样一来,意思虽然是一样的,但是论文查重就不会检查出飘红来,再不行的话,可以直接把飘红的那句删掉。要是非得要用的话,可以借助一些翻译软件,就是说你可以把那段话先翻译成英语,然后自己...
2018-04-16 21:02:43 1284
原创 一个简体字对应多个繁体字的例子
干:對應三個繁體字:(干)涉,(乾)燥,(幹)部; 后:對應兩個繁體字:(後)面,皇(后); 系:對應三個繁體字:唔(系),關(係),聯(繫); :對應兩個繁體字:(歷)史,日(曆); :對應兩個繁體字:時(鐘),(鍾)意; 板:對應兩個繁體字:老(闆),木(板); 表:對應兩個繁體字:手(錶),外(表); 丑:對應兩個繁體字:(醜)怪,子(丑)寅卯; 范:對應兩個繁體字:模(範)...
2018-04-15 22:51:07 5348
原创 爬取JS动态加载的页面
参考知乎:https://www.zhihu.com/question/21471960/answer/154098407 爬取网页上的评论:http://music.163.com/#/song?id=86375 请求评论数据的参数:params 和 encSecKey ,同时在Name栏目可以清楚地看到处理该参数的 js 文件为 core.js 美化JS代码后搜索这两个参数 ...
2018-04-14 19:30:37 15172
原创 使用requests.get下载大文件-Python
当使用requests的get下载大文件/数据时,建议使用使用stream模式。当把get函数的stream参数设置成False时,它会立即开始下载文件并放到内存中,如果文件过大,有可能导致内存不足。当把get函数的stream参数设置成True时,它不会立即开始下载,当你使用iter_content或iter_lines遍历内容或访问内容属性时才开始下载。需要注意一点:文件没有下载之前,...
2018-04-13 15:41:04 2051
原创 决策树的起源——Hunt算法
最早的决策树算法是由Hunt等人于1966年提出,Hunt算法是许多决策树算法的基础,包括ID3、C4.5和CART等,本文以Hunt算法为例介绍决策树算发的基本思想及决策树的一些设计问题。Hunt算法Hunt算法通过将训练记录相继划分为较纯的子集,以递归方式建立决策树。设Dt是与结点t相关联的训练记录集,而y = { y1, y2, …, yc}为类标号,Hunt算法的递归定义如下: ...
2018-04-09 23:23:49 16924
原创 sklearn使用LIAC-ARFF加载arff数据
LIAC-ARFF v2.1 Documentimport arffdataset=arff.load(open("D:/res/weather.numeric.arff"))In [12]: datasetOut[12]:{'attributes': [('outlook', ['sunny', 'overcast', 'rainy' ('temperature', 'NUM...
2018-04-09 19:46:00 2470
转载 下载积分攻略
下载积分攻略:1. 个人设置里进行手机绑定CSDN账户 奖励50分 (右上角设置-账户安全-手机绑定)2. 完成任务送若干分积分 http://task.csdn.net/3. 上传有效资源获取积分(上传非法,广告资源用户,将被扣除一定积分,严重者封号)。...
2018-04-08 23:08:23 95
转载 成为编程大牛很简单,把这些书看个八成就OK
程序员必读书单 1.0原文链接:http://lucida.me/blog/developer-reading-list/本文把程序员所需掌握的关键知识总结为三大类19个关键概念,然后给出了掌握每个关键概念所需的入门书籍,必读书籍,以及延伸阅读。旨在成为最好最全面的程序员必读书单。前言Read...
2018-04-06 15:19:55 377
原创 sklearn加载外部数据集
1.使用numpy.loadtxt2.解决Arff格式的方案参考.arff files with scikit-learn? & LIAC-ARFF v2.1使用scipy.io.arff.loadarfffrom scipy.io import arffdataset=arff.loadarff("D:/res/weather.nominal.arff")...
2018-04-03 14:22:45 10444 1
转载 绘制决策树的决策空间
reference: scikit-learn决策树算法类库使用小结from itertools import productimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.tree import DecisionTreeClassifier# ...
2018-04-03 08:45:49 856
原创 Sublime3搭建Python编译运行环境
1.使用Sublime3自带的Build SystemTools->Build System->New Build System 在窗口中输入:{ "cmd": ["D:/WorkSpace/env36/Scripts/python.exe","-u","$file"], "file_regex": "^[ ]*File \"(..
2018-04-02 10:16:47 367
转载 Ipython¬ebook的使用
pip install IPythonpip install urllib3 (安装IPython Notebook的依赖)pip install jupyter (安装IPython Notebook)pip install numpypip install matplotlibpip install pandaspip install scipypip install sciki...
2018-04-02 07:19:18 167
转载 Weka中的可视化
weka中ID3算法及可视化weka之对id3实现可视化scikit-learn决策树算法类库使用小结sklearn提供的自带的数据集sklearn教程
2018-04-02 07:14:48 3203
标准模板库自修教程与参考手册 STL进行C++编程.zip
2019-07-11
《Python深度学习》中英文及源代码2018
2018-11-18
Deep Learning with Python-Francois Chollet配套源代码
2018-11-18
Deep Learning with Python-Francois Chollet
2018-11-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人