- 博客(5)
- 资源 (6)
- 收藏
- 关注
原创 RapidMiner缺失数据处理——去掉数据大量缺失的变量
最近做数据挖掘,发现RapidMiner是一款数据清洗、处理和转换的好工具,尤其在数据量不大的情况下。和R语言相比,RapidMiner在数据处理方面要简单直观得多。虽然RapidMiner的功能可能不如R强大。另外,我们也可以在RapidMiner中可以直接利用Java/Groovy来编写程序,对数据进行处理和转换。现在以 RapidMiner6.0为例,来说明一下如何写一段小程序,去掉那些数据缺失量大于80%的变量。因为数据缺失量超过80%,我们很难补全它们。
2016-12-21 22:51:31 7890
原创 ElasticSearch多语言搜索入门(二)— 检测文本所使用的主要语言
要使用ElasticSearch的多语言索引及搜索功能,首先我们得检测原始文档所使用过的语言。ElasticSearch官网推荐使用MikeMcCandless 在Github上创建的chromium-compact-language-detector (URL地址:https://github.com/mikemccand/chromium-compact-language-detector)。但是我不熟悉Python语言,也没有搞明白在Java程序中如何调用该工具。搜索一番之后,发现Github上有个由
2016-12-16 16:20:10 5334
翻译 Elasticsearch多语言搜索入门(一)
Elasticsearch自带一套语言分析器(Analyzer),为世界上大多数语言提供良好的支持。
2016-12-16 10:43:04 6627
原创 在Windows下使用Curl工具完美操作ElasticSearch
Windows环境下如何使用Curl工具,输入多行命令操作ElasticSearch
2016-12-09 10:59:34 11774
原创 Java使用hotmail的SMTP服务器转发邮件出错
最近使用hotmail的SMTP在服务器上转发邮件,后台获得如下错误:javax.mail.AuthenticationFailedException: 535 5.0.0 Authentication Failedat com.sun.mail.smtp.SMTPTransport$Authenticator.authenticate(SMTPTransport.java
2016-12-03 22:55:40 5041
《Python机器学习》一书源代码下载
2017-12-31
Protege-5.2.0-win
2017-11-02
pdfbox1.0.jar
2010-01-26
ZK(AJAX开发工具)开发手册
2008-12-03
Oracle Database 10g OCP Certification All-in-One Exam Guide
2008-11-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人