自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Python机器学习基础编程

本文介绍了五种常见的机器学习算法及其实现方法。首先,使用KNN算法对鸢尾花数据集进行分类,通过训练和测试集划分进行模型训练与预测。其次,利用PCA对数据进行降维处理,将高维数据压缩为二维。接着,通过KMeans算法对鸢尾花数据进行聚类分析,并使用t-SNE进行可视化。然后,使用支持向量机(SVM)对乳腺癌数据集进行分类,展示了数据标准化和模型训练的过程。最后,通过线性回归模型对单变量数据进行拟合,并绘制回归线。这些示例展示了机器学习在不同任务中的应用,涵盖了分类、降维、聚类和回归等常见任务。

2025-05-12 17:54:42 353 2

原创 大数据处理与应用Hadoop复习必备

本文总结了Hadoop复习要点,主要包括以下内容:并行计算与分布式计算的异同:两者都通过并行处理提升性能,但内存分配和工作原理不同。并行计算共享内存,任务间紧密联系;分布式计算每个处理器独享内存,任务间独立。云计算服务层次:分为基础架构即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS),灵活度依次降低。Hadoop与云计算的关系:Hadoop是技术实现,云计算是业务建设,两者不等同。HDFS核心组件与特点:包括HDFS、YARN、MapReduce,HDFS不适合大量小文件,文件分

2025-05-08 23:15:32 477 4

原创 R语言基础(上)

rep(m:n,times=x,each=y) 从m到n的整数,循环x次,每个输出两遍。A<-matrix(m:n,nr=x,nc=y) 矩阵输出从m到n的整数,x行y列。如1:10-1 输出 [1] 0 1 2 3 4 5 6 7 8 9。如function(x,y)(x^3+x*y+sqrt(y)-x/y)> colnames(D)<-c("语文","数学","英语")如f<-function(x)(x^2+2*x+sqrt(x))D<-matrix(x,m,n)用x的值组成m行n列的矩阵。

2025-02-22 00:31:43 467 2

原创 HBASE的下载及安装(保姆级攻略)

(1)进入hbase的conf目录:cd /usr/hbase/hbase-1.2.4/conf。(1)编辑hbase-site.xml文件:vi hbase-site.xml。(1)创建一个用来存放hbase的目录 mkdir -p/usr/hbase。(2)编辑hbase-env.sh文件:vi hbase-env.sh。(2)将hbase文件压缩包上传至/opt/soft。(3)解压hbase安装包到/usr/hbase。2.配置conf/hbase-env.sh。(2) 配置环境变量:(4台机器)

2024-12-24 17:00:38 652 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除