机器学习
accomolate
这个作者很懒,什么都没留下…
展开
-
SparkR安装注意事项
系统环境为CentOS 6.5 + Spark 1.2.0。首先安装R,去官方网站下载R for linux源码,目前最新版为3.1.2,解压缩后在根目录执行./configure。若出现错误“configure: error: --with-readline=yes (default) and headers/libs are not available”,则执行yum instal原创 2015-01-07 13:53:45 · 1190 阅读 · 0 评论 -
在Python集成开发环境中调用Spark MLlib
Python拥有众多优秀的机器学习库如Scikit-Learn,然而这些机器学习库都在单机上运行,不支持集群上的分布式机器学习。Spark MLlib是Spark的机器学习库,并且支持Python。原创 2015-01-14 20:40:39 · 2988 阅读 · 0 评论 -
MLbase: A Distributed Machine-learning System 阅读笔记
前几日读过的一篇论文,笔记做成了ppt。原创 2014-12-26 15:34:25 · 883 阅读 · 0 评论 -
练习使用Python+Scikit-learn预测航班延误
按照这篇博客的步骤进行。由于系统中没有安装PIG,故没有按文中的方式生成训练和测试数据,而是用Spark生成。系统环境为JDK 1.7,Spark 1.2.0, Scala 2.10.4,Python 2.7. Python最好使用集成安装包如Anaconda安装,会安装大部分扩展包。1. 安装pydoop可以使用pydoop库访问HDFS。下载后解压,在根目录执行p原创 2015-01-21 19:31:26 · 5361 阅读 · 0 评论 -
练习使用Spark and ML-Lib 预测航班延误
按照这篇博客的步骤进行。其中有些注意事项列在下面。系统环境为JDK 1.7,Spark 1.2.0, Scala 2.10.4。1. 下载joda-convert 1.2, 将jar包加入IntelliJ IDEA的Library路径。2. 下载joda-time, 将jar包加入IntelliJ IDEA的Library路径。原创 2015-01-20 22:39:19 · 1976 阅读 · 1 评论 -
基于CNN的短文本分类实验 PPT
基于卷积神经网络的短文本分类实验,在搜狐新闻上取得了不错的分类效果,但情感分析的效果很差,需要继续改进。原创 2016-03-18 20:15:38 · 5843 阅读 · 3 评论