自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (6)
  • 收藏
  • 关注

原创 RapidMiner缺失数据处理——去掉数据大量缺失的变量

最近做数据挖掘,发现RapidMiner是一款数据清洗、处理和转换的好工具,尤其在数据量不大的情况下。和R语言相比,RapidMiner在数据处理方面要简单直观得多。虽然RapidMiner的功能可能不如R强大。另外,我们也可以在RapidMiner中可以直接利用Java/Groovy来编写程序,对数据进行处理和转换。现在以 RapidMiner6.0为例,来说明一下如何写一段小程序,去掉那些数据缺失量大于80%的变量。因为数据缺失量超过80%,我们很难补全它们。

2016-12-21 22:51:31 7890

原创 ElasticSearch多语言搜索入门(二)— 检测文本所使用的主要语言

要使用ElasticSearch的多语言索引及搜索功能,首先我们得检测原始文档所使用过的语言。ElasticSearch官网推荐使用MikeMcCandless 在Github上创建的chromium-compact-language-detector (URL地址:https://github.com/mikemccand/chromium-compact-language-detector)。但是我不熟悉Python语言,也没有搞明白在Java程序中如何调用该工具。搜索一番之后,发现Github上有个由

2016-12-16 16:20:10 5334

翻译 Elasticsearch多语言搜索入门(一)

Elasticsearch自带一套语言分析器(Analyzer),为世界上大多数语言提供良好的支持。

2016-12-16 10:43:04 6627

原创 在Windows下使用Curl工具完美操作ElasticSearch

Windows环境下如何使用Curl工具,输入多行命令操作ElasticSearch

2016-12-09 10:59:34 11774

原创 Java使用hotmail的SMTP服务器转发邮件出错

最近使用hotmail的SMTP在服务器上转发邮件,后台获得如下错误:javax.mail.AuthenticationFailedException: 535 5.0.0 Authentication Failedat com.sun.mail.smtp.SMTPTransport$Authenticator.authenticate(SMTPTransport.java

2016-12-03 22:55:40 5041

《Python机器学习》一书源代码下载

附件是《Python机器学习》 (美)塞巴斯蒂安·拉施卡(Sebastian Raschka) 著;高明,徐莹,陶虎成 译这本书的源代码,Ipython notebook格式的。大家也可从https://www.packtpub.com/books/content/support/30219网站直接下载。

2017-12-31

Protege-5.2.0-win

Protégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具,也是基于知识的编辑器,属于开放源代码软件。这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具,现在的最新版本为5.2.0版本 (截止2017年9月29日 )。

2017-11-02

pdfbox1.0.jar

使用PDFBox操作PDF 1.6版本时会出现错误: (1)pdfbox0.7.3 java.lang.NullPointerException at org.pdfbox.pdmodel.PDPageNode.getCount(PDPageNode.java:116) at org.pdfbox.pdmodel.PDDocument.getNumberOfPages(PDDocument.java:772) (2)pdfbox0.8 org.apache.pdfbox.exceptions.WrappedIOException at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:237) at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:841) at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:808) at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:733) pdfbox1.0能修复以上bugs

2010-01-26

ZK(AJAX开发工具)开发手册

ZK是用来开发RIA Web应用界面的利器,它是一个事件驱动的、以网页元素为基础的Web框架。ZK包含AJAX事件驱动引擎、一套丰富的界面组件及ZK用户界面开发语言(ZUML,一种XML语言)。

2008-12-03

Oracle Database 10g OCP Certification All-in-One Exam Guide

本书是为那些想考Oracle 10g OCP认证的朋友准备的,我前几天在图书馆借到一本,顺便把书后附带的电子书上传给需要的朋友。

2008-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除