自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (9)
  • 收藏
  • 关注

原创 Weka中ROC和AUC通过调用API实现

Weka中实现计算ROC的是ThresholdCurve类的getCurve函数(1)getCurve函数@param 一般是十折交叉得到的predictions @param 正例的类标记,多元分类问题,设置某个类别为正例,其他类别就是负例 @return datapoints if (pred.actual() == classIndex) { totPo...

2018-04-30 22:38:04 2053

原创 Weka中的Evaluation类源代码分析

使用的数据是最简单的weather.nominal.arff,使用的分类模型是NaiveBayes1.在构造函数中进行了如下操作:m_ClassPriors[numClasses]统计构造函数传入的data的各个类的先验概率,有一个平滑处理,在统计之前每个m_ClassPriors[i]都赋值为1,防止出现某个类先验概率为0的情况出现。m_MarginCounts = new doub...

2018-04-30 20:09:39 757

原创 第三章——发现群组

cnblog的订阅源:http://feed.cnblogs.com/blog/sitehome/rss cnblog的首页:https://www.cnblogs.com/ 将两者用浏览器打开后,可以发现有很多的相似之处,订阅源中的每一个entry就对应首页中的一篇博客...

2018-04-27 21:11:52 239

原创 Java内存的相关问题

为什么java获取的最大堆内存和设置的不一致Java 内存溢出(java.lang.OutOfMemoryError)的常见情况和处理方式总结Sublime Text 3 配置java运行环境Java OutOfMemory异常清单 —— 在自己的机器上制造内存溢出...

2018-04-27 16:32:59 130

原创 VisualVM——Java程序监控工具

自从 JDK 6 Update 7 以后已经作为 Oracle JDK 的一部分,位于 JDK 根目录的 bin 文件夹下(jvisualvm.exe),无需安装,直接运行即可。使用SizeOf测定JVM中对象占用内存...

2018-04-27 14:41:11 175

原创 第九章 高阶分类:核方法与SVM

用Bing Map服务代替Yahoo的Geocoding API Bing Map的相关网站: Bing Map 开发者中心 publice21@outlook Bing Map 的MSDN Bing Map 的MSDN 另一个文档 根据Bing Map修改后的部分代码:BingKey="AudmvxyrHM35ktbN5bLBPtVL24Yst22RTfIyRSxzr45r7aY9...

2018-04-27 12:26:45 321

原创 Weka分布式实验

File协议 startRemoteEngine.shjava -Xmx1024m -classpath ../db_drivers/mysql-connector-java-5.1.46.jar;remoteEngine.jar;../weka3.7.13.jar -Djava.security.policy=remote.policy weka.experiment.RemoteE...

2018-04-26 16:39:37 563

原创 Ubuntu安装MySQL

sudo apt-get install mysql-server会提示你设置密码,如果安装时没有设置密码的解决办法参考ubuntu安装mysql 时未提示输入密码udo apt isntall mysql-clientsudo apt install libmysqlclient-dev安装成功后可以通过下面的命令测试是否安装成功:sudo netstat -tap |...

2018-04-26 10:46:42 164

原创 免费的开源数据挖掘工具

Orange,RapidMiner,Weka,JHepWork,KNIM,五个免费开源的数据挖掘软件

2018-04-25 23:45:13 744

原创 Ubuntu服务器安装桌面

Ubuntu14.04 server 安装桌面从零开始配置Ubuntu Server 14.04 图形界面、Caffe安装及远程连接Ubuntu 16.04 server 图形界面注意最后修改启动项 如何默认不启动桌面,等需要时再启用。 /etc/default/grub GRUB_CMDLINE_LINUX_DEFAULT=”” 改为 “text”,然后upda...

2018-04-25 12:54:34 4897

原创 Xshell5评估期已过

正在使用的xshell 5不能使用,提示xshell 5评估期已过,重新安装还是不行。其实xshell 5有免费版的,即Home & school 版本。卸载原程序,下载安装免费版本的xshell 5即可。免费版本的链接:http://www.netsarang.com/download/free_license.html...

2018-04-25 12:38:08 1477

原创 UCI数据集转化为Arff数据集

以Adult数据集为例 将adult.data.txt文件改为csv格式,用Weka Explorer打开adult.data.csv然后保存为arff文件。 将adult.test.txt文件也作如上操作,会出现错误: |1x3 Cross validator25, Private, 226802, 11th, 7, Never-married, Machine-op-inspc...

2018-04-25 07:38:43 1759

原创 计算机辅助翻译CAT——OmegaT

轻松愉快的辅助翻译工具OmegaT的简单使 OmegaT - 开源跨平台的电脑辅助翻译工具软件入门与下载 (Win/Mac/Linux)

2018-04-18 13:44:56 2015

转载 ROC and AUC

参考: ROC和AUC介绍以及如何计算AUC 多分类下的ROC曲线和AUCROC曲线首先ROC分析的是二元分类模型,也就是输出类别只有两种值的分类模型。对于其他的多类分类模型可以做相应的转换,本文后面再作分析。ROC曲线的特点:ROC曲线的横轴是False postive rate,纵轴是True positive rate一个特定分类模型在一个测试数据集上只会得到一个FP...

2018-04-17 13:23:29 396

原创 本科论文查重

降低重复率的方法(1) 网上的资源都是相互有着关联的,要是直接把原话拿来用是很容易就被检查出来的。可以在写的时候变化一下,换个关键词,用意思相同的词来替换原文中的词语。也可以变一下句子的结构,用自己的话重新改写一下,这样一来,意思虽然是一样的,但是论文查重就不会检查出飘红来,再不行的话,可以直接把飘红的那句删掉。要是非得要用的话,可以借助一些翻译软件,就是说你可以把那段话先翻译成英语,然后自己...

2018-04-16 21:02:43 1284

原创 一个简体字对应多个繁体字的例子

干:對應三個繁體字:(干)涉,(乾)燥,(幹)部; 后:對應兩個繁體字:(後)面,皇(后); 系:對應三個繁體字:唔(系),關(係),聯(繫); :對應兩個繁體字:(歷)史,日(曆); :對應兩個繁體字:時(鐘),(鍾)意; 板:對應兩個繁體字:老(闆),木(板); 表:對應兩個繁體字:手(錶),外(表); 丑:對應兩個繁體字:(醜)怪,子(丑)寅卯; 范:對應兩個繁體字:模(範)...

2018-04-15 22:51:07 5348

原创 关于前端Web技术的几点——网络爬虫的技术储备

阅读大型 JavaScript 源码时有什么好用的工具?web前端开发分享-css,js工具篇

2018-04-14 20:07:54 812

原创 爬取JS动态加载的页面

参考知乎:https://www.zhihu.com/question/21471960/answer/154098407 爬取网页上的评论:http://music.163.com/#/song?id=86375 请求评论数据的参数:params 和 encSecKey ,同时在Name栏目可以清楚地看到处理该参数的 js 文件为 core.js 美化JS代码后搜索这两个参数 ...

2018-04-14 19:30:37 15172

原创 使用requests.get下载大文件-Python

当使用requests的get下载大文件/数据时,建议使用使用stream模式。当把get函数的stream参数设置成False时,它会立即开始下载文件并放到内存中,如果文件过大,有可能导致内存不足。当把get函数的stream参数设置成True时,它不会立即开始下载,当你使用iter_content或iter_lines遍历内容或访问内容属性时才开始下载。需要注意一点:文件没有下载之前,...

2018-04-13 15:41:04 2051

原创 决策树的起源——Hunt算法

最早的决策树算法是由Hunt等人于1966年提出,Hunt算法是许多决策树算法的基础,包括ID3、C4.5和CART等,本文以Hunt算法为例介绍决策树算发的基本思想及决策树的一些设计问题。Hunt算法Hunt算法通过将训练记录相继划分为较纯的子集,以递归方式建立决策树。设Dt是与结点t相关联的训练记录集,而y = { y1, y2, …, yc}为类标号,Hunt算法的递归定义如下: ...

2018-04-09 23:23:49 16924

原创 sklearn使用LIAC-ARFF加载arff数据

LIAC-ARFF v2.1 Documentimport arffdataset=arff.load(open("D:/res/weather.numeric.arff"))In [12]: datasetOut[12]:{'attributes': [('outlook', ['sunny', 'overcast', 'rainy' ('temperature', 'NUM...

2018-04-09 19:46:00 2470

转载 下载积分攻略

 下载积分攻略:1. 个人设置里进行手机绑定CSDN账户 奖励50分 (右上角设置-账户安全-手机绑定)2. 完成任务送若干分积分      http://task.csdn.net/3. 上传有效资源获取积分(上传非法,广告资源用户,将被扣除一定积分,严重者封号)。...

2018-04-08 23:08:23 95

转载 成为编程大牛很简单,把这些书看个八成就OK

程序员必读书单 1.0原文链接:http://lucida.me/blog/developer-reading-list/本文把程序员所需掌握的关键知识总结为三大类19个关键概念,然后给出了掌握每个关键概念所需的入门书籍,必读书籍,以及延伸阅读。旨在成为最好最全面的程序员必读书单。前言Read...

2018-04-06 15:19:55 377

转载 sklean中的NaiveBayes

朴素贝叶斯理论推导与三种常见模型

2018-04-03 21:11:00 396

原创 sklearn加载外部数据集

1.使用numpy.loadtxt2.解决Arff格式的方案参考.arff files with scikit-learn? & LIAC-ARFF v2.1使用scipy.io.arff.loadarfffrom scipy.io import arffdataset=arff.loadarff("D:/res/weather.nominal.arff")...

2018-04-03 14:22:45 10444 1

转载 绘制决策树的决策空间

reference: scikit-learn决策树算法类库使用小结from itertools import productimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.tree import DecisionTreeClassifier# ...

2018-04-03 08:45:49 856

原创 Sublime3搭建Python编译运行环境

1.使用Sublime3自带的Build SystemTools->Build System->New Build System 在窗口中输入:{ "cmd": ["D:/WorkSpace/env36/Scripts/python.exe","-u","$file"], "file_regex": "^[ ]*File \"(..

2018-04-02 10:16:47 367

转载 Python函数与高级语法合集

Python中的zip()与*zip()函数详解python笔记之NUMPY(二)

2018-04-02 09:36:17 1315

转载 Ipython&notebook的使用

pip install IPythonpip install urllib3 (安装IPython Notebook的依赖)pip install jupyter (安装IPython Notebook)pip install numpypip install matplotlibpip install pandaspip install scipypip install sciki...

2018-04-02 07:19:18 167

转载 Weka中的可视化

weka中ID3算法及可视化weka之对id3实现可视化scikit-learn决策树算法类库使用小结sklearn提供的自带的数据集sklearn教程

2018-04-02 07:14:48 3203

标准模板库自修教程与参考手册 STL进行C++编程.zip

标准模板库自修教程与参考手册 STL进行C++编程(第二版)高清pdf,文字和代码高清版本,书籍浅显易懂非常适合入门STL的学习

2019-07-11

《Python深度学习》中英文及源代码2018

keras之父Francois Chollet的最新作品,deep learning最佳入门与进阶的指南,包括中文版和英文版以及配套源代码,均为高清文字版本,非扫描版

2018-11-18

Deep Learning with Python-Francois Chollet配套源代码

Deep Learning with Python-Francois Chollet的配套源代码

2018-11-18

Deep Learning with Python-Francois Chollet

keras之父Francois Chollet的最新作品,deep learning最佳入门与进阶的指南

2018-11-18

tensorflow 官方文档中文版

tensorflow官方文档的中文翻译版,适合作为初学tensorflow的指南

2018-11-06

manchine learning yearning 中文版

吴恩达(andrew ng)的新书Machine learning yearning 的中文翻译版

2018-11-06

C++写的机器学习的库

一个用C++写的机器学习的库,作者是Ron Kohavi,是SGI的一个开源项目

2018-06-11

《精通Hadoop》源代码

《精通Hadoop》Mastering Hadoop 人民邮电出版社,源代码

2017-11-14

lab38综合实战-搜索引擎

《大数据实验手册》实验38-综合实战-搜索引擎 包含CreateIndex和Demo

2017-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除