自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

weixin_40700855的博客GJB

简洁全面、细致实用的大数据、云计算和机器学习技术提供

  • 博客(9)
  • 收藏
  • 关注

原创 cdh6.0安装部署

1.环境准备 1.1.安装包 下载地址:https://archive.cloudera.com/cdh6/6.0.1/parcels/ https://archive.cloudera.com/cm6/6.0.1/redhat7/yum/RPMS/x86_64/ 安装包清单: 系统和iso镜像: 1.2.物理机或虚拟机 cdh集群至少三台物理机或虚拟机,各主机内存在16G以上; 使用虚拟机搭...

2019-08-06 20:51:13 1017 1

原创 8.2 机器学习算法

1. 机器学习算法汇总 ①回归模型(用于预测):最小二乘法、逻辑回归、逐步回归、多元自适应样条法、本地权重评估、 ②正则化模型(提升泛化):岭回归、LASSO回归、弹性网、最小角回归、 ③决策树模型(分类和预测):CART树、ID3算法树、C4.5算法树、卡方自动交叉效验树、M5算法树、 ④集成模型(提升准确度):Boosting、Bagging装袋算法、层叠泛化算法、梯度提升机算法、梯度提升回...

2019-08-07 20:43:02 209

原创 8.1 机器学习和数据挖掘介绍

1. 基础概念: 数据挖掘:data mining,又称为KDD【数据库知识发现,knowledge discovery from databases】,它是一个从大量数据中抽取挖掘出未知的、有价值的模式和规律等知识的复杂过程;相关组成包括: 数据:原材料,描述发生了什么事;//不构成决策和行动; 信息:分析数据找出意义和关联;//也不作为判断、决策和行动依据; 知识:对信息更深入的归纳分析得...

2019-08-07 20:35:46 255

原创 7.1 云计算初识

1. Iaas、Paas、Saas Iaas:Infrastructure as a Service基础设施即服务,个体可以租用外部专业公司的服务器【计算能力、存储、网络硬件】;节省了维护成本和办公场所; Paas:Platform as a Service平台即服务,个体可以租用外部专业公司的虚拟服务器和平台方案【计算能力、存储、网络硬件、系统平台、流程方案】;节省了时间和资源,同时分散的工作...

2019-08-07 19:39:08 144

原创 5.1 cdh基础优化一

1. linux ①禁用透明大页面压缩: echo never > /sys/kernel/mm/transparent_hugepage/defrag echo never > /sys/kernel/mm/transparent_hugepage/enabled ②优化交换分区: 修改文件vim /etc/sysctl.conf 【追加一行】 vm.swappiness = 10...

2019-08-07 16:09:42 122

原创 6.1 eclipse开发springboot一:安装sts

1. 安装sts方式一:在线安装 选择eclipse菜单栏:help—》Eclipse Marketplace—》搜索sts—》选择Spring Tools 3 Add-on安装; 2. 安装sts方式二:离线安装【推荐】 2.1. 下载插件包 通过eclipse的help栏中“about eclipse ide”查看eclipse版本; 根据eclipse版本,在官网中 https://sp...

2019-08-07 15:58:55 192

原创 3.1 进程与线程、调度算法

一. 进程 1.1 进程概念 进程=程序+执行,当把一个程序从磁盘中加载到内容中,cpu去运算和处理这个进程(运行起来的程序就是进程); 1.2 进程模型的三个维度 1.3 进程模型的发展 原始的操作系统为单道编程:一个程序执行完,再执行下一个; 缺陷明显: ①响应时间慢【用户体验差】; ②cpu利用率比较低【假设一个进程包含20%cpu计算和80%的io,io时cpu是闲置的,cpu利用率为...

2019-08-06 18:26:55 114

原创 2.1 服务器rhel6和rhel7配置本地或网络yum源

服务器或虚拟机无本地yum源或网络yum源,将无法使用yum方式安装依赖包; 一. rhel6虚拟机配置本地yum源 一般虚拟机挂载的 iso 镜像为 sr0 或 cdrom;可进入服务器 /dev目录下查看;以镜像为 sr0 为例制作本地yum源: mount /dev/sr0 /mnt/cdrom vi /etc/yum.repos.d/yum.repo 添加以下内容: [yum] name=...

2019-08-06 15:24:13 178

原创 1.1 linux初识

一. linux简介 linux内核最初只是由芬兰人李纳斯•托瓦兹(Linus Torvalds)【也就是linux之父】在赫尔辛基大学上学时出于个人爱好而编写的; Linux是一套免费使用和自由传播的类Unix操作系统【从linux 0.01版本即开源】,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统; Linux能运行主要的UNIX工具软件、应用程序和网络协议...

2019-08-05 11:44:10 85

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除