- 博客(2)
- 收藏
- 关注
原创 Windows连上Hadoop集群做分词练习
Hadoop框架的核心设计就是:HDFS(Hadoop distribution file system)和MapReduce。适合有着超大数据集的程序。HDFS为海量数据提供了存储具有高容错性的特点并且设计用来部署在低廉的硬件上。MapReduce则为海量数据提供了计算。 利用WINDOWS连上Hadoop集群需要通过2个步骤。1.通过PUTTY等SSH软件连上远程服务器,将数据集及脚本程序上
2017-08-09 11:31:21 391
原创 Scikit-learn安装
Scikt在基于Python的机器学习中非常有用。安装地址如下http://scikit-learn.org/stable/install.html。因之前已经安装过了Anaconda 3,使用pip install -U scikit-learn命令安装。在scikit-learn官网上一共有regression、classification、clustering、dimenstional
2017-05-22 17:18:49 1102
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人