- 博客(5)
- 资源 (8)
- 收藏
- 关注
原创 特征工程
数据和特征决定了模型的上限,算法只是在帮忙逼近这个上限。1.显性特征:可以理解为用户直接可以拿到的数据字段2.半隐性特征:用户数据在通过GBDT等算法的计算过程中产出的一些特征3.隐性特征:深度学习在很大程度上可以简化人肉特征工程的工作量,因为深度学习可以在计算过程中自动生成一些特征向量,这些特征的表达往往是不可解释的,那这些特征就是隐性特征。显性特征:1.数据清洗...
2018-06-19 20:49:01 630
原创 ubuntu安装tpcc-mysql以及使用
Tpcc-mysql是percona基于tpcc衍生出来的产品,专用于mysql基准测试,可运行于 Windows、GNU/Linux、UNIX 以及 Mac OS 系统之上。一 安装下面是在ubuntu上安装tpcc具体步骤: 1.安装make工具,执行sudo apt-get install make 2.安装git,执行sudo apt-get install git...
2018-06-17 10:47:43 1340
原创 java kafka写入数据到HDFS
安装kafka,见我以前的博文https://blog.csdn.net/u013385018/article/details/80529063向Hdfs写入文件,控制台会输出以下错误信息:Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException): Perm...
2018-06-14 10:49:26 9065
原创 单机安装hadoop
一、安装Java在安装 hadoop 之前,请确保你的系统上安装了 Java。使用java -version命令检查已安装 Java 的版本。 查看java 路径,要记住该路径,后面配置hadoop时会用到二、安装hadoop1.创建用于 hadoop 安装的系统帐户hadoop[root@localhost ~]# useradd hadoop[root@localhost ~]# passwd...
2018-06-14 10:32:47 960
原创 Hadoop,Spark,Hbase单机安装
SparkHiveContext和直接Spark读取hdfs上文件然后再分析效果区别直接Spark读取hdfs上文件然后再分析快20倍https://www.cnblogs.com/Kaivenblog/p/7777596.hthadoop-hbase-spark单机版安装https://www.cnblogs.com/jixiangxiang/p/5520851.htmlSSH的详细安装步骤及登...
2018-06-04 09:41:14 585
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人