机器学习笔记(一)——基础环境

机器学习笔记(一)——基础环境

前言

机器学习基础阶段会用到Matplotlib、Numpy、Pandas等库,为了方便可以统一安装Anacond,利用Jupyter Notebook来学习。

Anacond

介绍

Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 因为包含了大量的科学包,Anaconda 的下载文件比较大(约 531 MB),如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)。

Conda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换

Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等

Miniconda包括Conda、Python

安装

安装教程网上很多,这个实践过,比较靠谱:https://www.cnblogs.com/IT-LearnHall/p/9486029.html

Jupyter Notebook

安装好Anaconda之后,系统会自带Jupyter Notebook软件

介绍

Jupyter项目是一个非盈利的开源项目,源于2014年的ipython项目,逐渐发展为支持跨所有编程语言的交互式数据科学和科学计算。

  • Jupyter Notebook,原名IPython Notbook,是IPython的加强网页版,一个开源Web应用程序
  • 名字源自Julia、Python 和 R(数据科学的三种开源语言)
  • 是一款程序员和科学工作者的编程/文档/笔记/展示软件
  • .ipynb文件格式是用于计算型叙述的JSON文档格式的正式规范

意义

  • 传统软件开发:工程/目标明确

  • 需求分析,设计架构,开发模块,测试

  • 数据挖掘:艺术/目标不明确

  • 目的是具体的洞察目标,而不是机械的完成任务

  • 通过执行代码来理解问题

  • 迭代式地改进代码来改进解决方法

Jupyter Notebook:实时运行的代码、叙事性的文本和可视化被整合在一起,方便使用代码和数据来讲述故事。

Jupyter Notebook 相比 Pycharm 在画图和数据展示方面更有优势。

使用

Jupyter Notebook使用教程也是众说纷坛,找了一份比较好入门的推荐出来:https://cloud.tencent.com/developer/news/323834

最后

学习笔记,温故知新。有任何问题请留言,谢谢!

下一篇:机器学习笔记(二)——Numpy

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我知道了,下面是我的回答: 聚类算法是一种无监督学习算法,它可以将数据集中的数据按照某种规则进行分组,使得同一组内的数据相似度较高,不同组之间的数据相似度较低。聚类算法可以帮助我们对数据进行分类、分析和理解,同时也可以为其他机器学习任务提供数据预处理和特征提取的支持。 聚类算法的基本流程包括:确定聚类算法的目标函数、选择相似度度量方法、选择聚类算法、确定聚类的数量、进行聚类操作以及评估聚类效果。常见的聚类算法包括K-Means算法、层次聚类算法、密度聚类算法等。 K-Means算法是一种基于距离的聚类算法,它的基本思想是将数据集中的数据划分为K个簇,使得同一簇内的数据相似度较高,不同簇之间的数据相似度较低。K-Means算法的优点是计算复杂度较低,容易实现,但是需要预先指定簇的数量和初始聚类中心。 层次聚类算法是一种基于相似度的聚类算法,它的基本思想是不断合并数据集中相似度最高的数据,直到所有数据都被合并为一个簇或达到预先设定的簇的数量。层次聚类算法的优点是不需要预先指定簇的数量和初始聚类中心,但是计算复杂度较高。 密度聚类算法是一种基于密度的聚类算法,它的基本思想是将数据集中的数据划分为若干个密度相连的簇,不同簇之间的密度差距较大。密度聚类算法的优点是可以发现任意形状的簇,但是对于不同密度的簇分割效果不佳。 以上是聚类算法的基础知识,希望能对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值