木木竹
码龄14年
关注
提问 私信
  • 博客:68,324
    社区:5,907
    74,231
    总访问量
  • 25
    原创
  • 1,734,916
    排名
  • 50
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2010-12-11
博客简介:

a376554764的博客

查看详细资料
个人成就
  • 获得51次点赞
  • 内容获得22次评论
  • 获得221次收藏
创作历程
  • 1篇
    2020年
  • 20篇
    2019年
  • 4篇
    2018年
成就勋章
TA的专栏
  • 大数据
    3篇
  • Flink
    3篇
  • Zeppelin
  • Hbase
    1篇
  • sprintboot
    1篇
  • 机器学习
    15篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

344人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hbase2.0版本协处理器的编写、加载与卸载

协处理器代码编写2.0版本之前,要想自己写协处理器,需要implement BaseRegionObserver2.0版本之后,则与之前有所不同,需要implement RegionObserver,RegionCoprocessor。同时还必须实现一个方法@Overridepublic Optional<RegionObserver> getRegionObserver() { return Optional.of(this);}如果没有添加此方法会报以下错误:2020
原创
发布博客 2020.07.05 ·
1450 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

kudu原理与使用

1、 kudu简介1.1、kudu是什么?简单来说:dudu是一个与hbase类似的列式存储分布式数据库。官方给kudu的定位是:在更新更及时的基础上实现更快的数据分析1.2、为什么需要kudu?1.2.1、hdfs与hbase数据存储的缺点目前数据存储有了HDFS与hbase,为什么还要额外的弄一个kudu呢?HDFS:使用列式存储格式Apache Parquet,Apache O...
原创
发布博客 2019.04.22 ·
51531 阅读 ·
42 点赞 ·
15 评论 ·
207 收藏

Centos6.10安装impala集成kudu之错误

Centos6.10安装impala集成kudu时,修改了hdfs-site.xml文件时,加入了下面属性:<property><name>dfs.domain.socket.path</name><value>/var/run/hdfs-sockets/dn</value></property>然后重新启动hdf...
原创
发布博客 2019.04.12 ·
712 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Centos7安装kudu

1、下载kudu rpm包下载地址:https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5.14.0/RPMS/x86_64/下载rpm包如下:kudu-1.6.0+cdh5.14.0+0-1.cdh5.14.0.p0.47.el7.x86_64.rpmkudu-client0-1.6.0+cdh5.14.0+0-1.cdh5.14...
原创
发布博客 2019.04.10 ·
1081 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

随机森林

原创
发布博客 2019.03.18 ·
211 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

逻辑回归

原创
发布博客 2019.03.18 ·
172 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

岭回归

原创
发布博客 2019.03.18 ·
385 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

线性回归

原创
发布博客 2019.03.18 ·
123 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

分类模型的评估

原创
发布博客 2019.03.18 ·
163 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

模型的选择与调优

原创
发布博客 2019.03.18 ·
279 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

回归性能评估

原创
发布博客 2019.03.18 ·
545 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

决策树

原创
发布博客 2019.03.17 ·
119 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

朴素贝叶斯

原创
发布博客 2019.03.17 ·
100 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

K-近邻算法【KNN】

原创
发布博客 2019.03.17 ·
134 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器学习基础

数据类型: 离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。 连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。离散型是区间内不可分,连续型是区间内可分机器学习算法分类:监督学习(有特征值+目...
原创
发布博客 2019.03.17 ·
93 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

转换器与预估器

1、转换器: 之前特征工程里面实例化的例如:CountVectorizer,其实就是一个转换器2、预估器:分类器和回归器都属于estimator,是一类实现了算法的API用于分类的预估器: sklearn.neighbors k-近邻算法 sklearn.naive_bayes 贝叶斯 skl...
原创
发布博客 2019.03.17 ·
411 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

数据集的获取与划分

机器学习的数据集一般划分为两个部分:1、训练集:用于训练,构建模型2、测试集:在模型检验时使用,用于评估模型数据集划分API:sklearn.model_selection.train_test_split练习时可以使用sklearn提供的数据集sklearn数据集的获取:sklearn.datasets 加载获取流行数据集 datasets.loa...
原创
发布博客 2019.03.17 ·
1010 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

特征工程

1、特征工程是什么特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性2、特征工程的意义直接影响模型的预测结果3、scikit-learn库介绍安装scikit-learn库:pip install Scikit-learn4、数据的特征抽取1、sklearn特征抽取API:sklearn.feature_extracti...
原创
发布博客 2019.03.17 ·
323 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

机器学习概述

1、机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测2、学习时的数据集Kaggle网址:https://www.kaggle.com/datasetsUCI数据集网址: http://archive.ics.uci.edu/ml/scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html...
原创
发布博客 2019.03.17 ·
103 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Springboot2.0中Hibernate默认创建的mysql表字符集不为UTF8问题

在做机器学习平台时,用到的springboot+jpa通过@Entity生成的表,字符集为latin1,引擎为MyISAM,导致存入表中的中文乱码,只需要下面代码即可将创建的表引擎为InnoDB,字符集为utf8import org.hibernate.dialect.MySQL5InnoDBDialect;public class MysqlConfig extends MySQL5Inn...
原创
发布博客 2019.02.27 ·
1598 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏
加载更多