数据分析之预备知识学习笔记

1,前言

现在,又打开一篇专栏,数据分析。

这是我的专业,顺便当是记笔记。然后把代码也复制上来,方便以后用。

2,anaconda

一开始我也想anaconda是什么东西?与其说东西,不如说这是什么软件。

他是个管理包的软件。因为提到了包,我去百度了一下包和库不是一个东西。还带出来了一个名词

2.1,模块、包和库是什么

模块(module)

模块就是.py 文件。

所以我在想我一直在写模块?以现阶段说我写的每一个小实例都是以.py 后缀结尾。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AesyatC9-1647351093241)(https://cdn.jsdelivr.net/gh/yanghuanh1314/MyPicture@master/一个py模块.png)]

这就是一个最简单的模块。我设定的功能是输出hello world。放在hello()函数里

那我们也可以import 导入?我看看怎么调用

调用hello

import helllo ,导入这个模块;调用 hello()函数,设置参数为5;输出hello world

那我提出一个问,在我以往的学习里库也是这么使用的?难不成我编写了一个库?python确实可以让开发者编写库。但是我有这么本事?

包(package)

我看了许多文章,我可以确定的是包就是一个文件夹。/里面包含了许多python文件。其中有一个__init__.py 文件。

为什么会出现包这个名词。就是说在以后写的大型项目里面会用到许许多多的模块。如果让他们散着,不方便管理

包的导入:

  1. import 包名[模块名[as 别名]]
  2. from 包名 import 模块名 [as 别名]
  3. from 包名 模块名 import 成员名 [as 别名]

库(library)

库就是别人写好的代码,我们直接拿过来用。我想了想,之前pip install 下的库确实是现成的,我们直接拿过来用。

一定功能代码的集合

标准库、第三方库和自定义模块。

2.1.1总结

了解了这么多,我明白了一点点。欢迎大家指错

模块就是我们自己写的代码.py 文件吗,实现某一个功能;

包,完成大型项目时可能会用的成千上万(有点夸张)的模块,为了方便管理,给他们放进一个包里。其中包里有一个__init__.py文件。

库,有人说是模块与包的统称。一系列代码的集合,拿来就用,提到都三方库,就是别人写好了,你用。

2.2,anaconda介绍

这是一个管理python包相关的软件。许多的包都已经是给我们下载好了。这里更多的支是科学包,现在我学的是数据分析。可见这和以往不同。所以我就是这么想的。

同时具有强大的python环境管理。因为他包含了python的发行版本。这个我会解释,目前我是知道python有两个环境python2.x和python3.x与此同时他们之间互不兼容。之前看到一篇文章,说着就是有的包只能在python2x上面运行。运行n个python环境,你也方便管理。

也可以把这个理解成python。我看网上也有人说安装这个就不需要安装python的解释器了。

开源、免费。

2.3,Anaconda、conda、pip三中的区别

2.3.1,Anaconda与conda

Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。

怎么理解呢,是不是有点懵,一开始我写的是anaconda是一个包管理工具,现在conde也是一个管理工具。什么意思呢?我又去百度,更多的理解是anaconda是一个python的发行版本,而conda是一个工具,管理包的工具。在命令行中使用。这个工具在下载anaconda的时候已经下载了。这个就很像你在下载python的时候pip已经下载好了。现在anaconda是python,则conde是pip。

管理包的工具是很清楚了卸载、更新、下载

2.3.2,conde与pip的区别

现在知道了conda是一个包管理工具

那大家有没有想过pip是啥,pip install xxx 我们在干嘛。

pip是python的包管理工具,提供下载、查找、卸载和安装的功能。

pip不会安装包的依赖项,而anaconda不仅安装包,还有他们的依赖项

还有一个原因pip只是针对python使用,而conda不仅python几乎覆盖大部分语言(C/C++、Java、R…),就是说pip只能安装python的包,而anaconda所有语言通吃。

总结

打开了很多网页,从哔哩哔哩到知乎,就写了三行,大概两百多个字。

那么anaconda是什么。这个可以说是我是这么理解的。

学习数据分析你肯定需要下载大量的第三方库吧。而且有的库还有个性,你安不上。

我在微信上看了一篇相关文章,anaconda是什么,给出了一个公式

anaconda = python + 常用第三方库 + ide

这就是个python的全家桶,有python的解释器,ide、常用第三方库。

然后安装anaconda的时候送你一个conda,更方便。

3,anaconda的下载及配置

最不喜欢的就是配置,我老是配置不成功,难受,c语言我至今还没搞明白他的编译器怎么配置。

emmm…这里省略一万字。

怎么看是否安装成功呢?

两种方法,conda -v 这种方法比较常见,看他的版本,可以返回,安装成功。

然后是输入python 后面会出现anaconda。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-31vFBb1t-1647351093244)(https://cdn.jsdelivr.net/gh/yanghuanh1314/MyPicture@master/anaconda安装配置.png)]

4,一些名词

  1. 引入习惯

    import numpy as np
    import matplotlib.pyplot as plt
    import pandas as pd
    import seaborn as sns
    import statsmodels as sm
    

    引入这些模块后用他的别名,这样会更方便一些,提升效率。

  2. 专业名词

    • 数据规整:将一些非结构化数据或者散乱的数据处理成结构化或者整洁形式数据的过程。
    • 伪码:不是程序的源代码,而是对算法或者过程的描述
    • 语法糖:让代码易读易写。

4.2,重要的python库

  1. NumPy:处理多维数组和矩阵运算的库。是python科学计算的基础包
  2. pandas:用于数据处理、清洗、分析
  3. matplotlib:用于绘制图表或二维数据可视化
  4. SciPy:是一个高级科学计算库,比numpy还厉害。
  5. scikit-learn:机器学习
  6. statsmodels:统计分析

这里说的三言两语。在以后用到的时候我们在长篇大论。

5,总结

介绍了一个重要的包,anaconda,然后就是一个工具conda工具。

还有纠正了我以前一个错误的误区,模块是我们自己写的,.py 文件就是模块。库并不是python的专属,而包是一个文件夹,包含了许多模块。

anaconda与其说是包,实际上是一个python的发行版。

一些专业术语和常用到的库。

这就是以上内容,我的笔记。

谢谢您的,文章有错误,欢迎你的指正;如果对您有帮助,是我的荣幸。
一个错误的误区,模块是我们自己写的,.py 文件就是模块。库并不是python的专属,而包是一个文件夹,包含了许多模块。

anaconda与其说是包,实际上是一个python的发行版。

一些专业术语和常用到的库。

这就是以上内容,我的笔记。

谢谢您的,文章有错误,欢迎你的指正;如果对您有帮助,是我的荣幸。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值