python和anaconda区别_不能错过!超全Anaconda(Python整合包)导修(图文详解)

全文共2653字,预计学习时长10分钟

adaf2edda3cc7cd9e315dd451e1d2939b80e9110.jpeg?token=f80de243622261d63c19c06df8acc7f5&s=595120C4D04121552604059C0300709A图源:Pexels

Anaconda是一个供数据科学家、IT专家,和商业领袖使用的数据科学平台,是Python、R语言等的一个发行版。针对数据科学,它有超过300个软件包,因此它迅速攀升为最好的数据平台之一。本篇导修将会探讨如何运用Anaconda帮助Python编程。以下是本文要探讨的主题:

Anaconda介绍安装和启动如何将Python库导入AnacondaAnacondaNavigator使用场景:

○ Python基础

○ 数据分析

○ 机器学习和人工智能

*CDH:Cloudera’s Distribution Including Apache Hadoop.

Cloudera包括Apache Hadoop的发行版本。

94cad1c8a786c917ec51ae3b9e2178c93bc75700.jpeg?token=0e9bcbb9684fc8224240e0fd06596b7f

Anaconda介绍

Anaconda是Python和R的开源发行版本。它能够用于数据科学,机器学习,深度学习等领域。它能够让用户接触到超过300个数据库,因此对于任何程序员而言,Anaconda都是数据科学研究的上选。

5243fbf2b211931391e0c504482404d190238d80.jpeg?token=f27005bf42e5733fb89c081c53905df5&s=5D823C72CD27C4034C50BD47030030F1

Anaconda能够帮助简化软件包的管理和部署,它还匹配了多种工具,可以使用各种机器学习和人工智能算法轻松地从不同的来源收集数据。Anaconda还可以使用户获得一个易于管理的环境设置——用户只需点击按钮就可以部署任何项目。

相信你们对Anaconda已经有了一个基本概念,接下来了解如何安装它,并设置一个能够在系统上工作的环境。

94cad1c8a786c917ec51ae3b9e2178c93bc75700.jpeg?token=0e9bcbb9684fc8224240e0fd06596b7f

安装和启动

想要安装Anaconda,可以进入这个网站。

3b292df5e0fe992524c59b6a06b456d98cb171e5.png?token=990d365817a07071e1c84c4ea23ca13c&s=59A83C728BE855015A51EDDA0300C0B3下载页面

选择一个适合的版本然后点击下载。完成下载后,打开启动页面。

fc1f4134970a304e40f780eee5d4af80c8175cea.jpeg?token=3e8e611eaffd7ace5a8997831cd514b3&s=537A7ADA1FA4548EC36C275A030040F6Anaconda启动

遵循启动页中的指令,记得点击添加Anaconda到路径环境变量里。安装完成后,你会看到一个和下图一样的窗口:

cb8065380cd791238442b9319a285184b3b780f2.jpeg?token=1a67f9fd715c460cbb0ed6114b58a8bc&s=536AFA5A5FB4448E8B6C265A020040F6安装完成

安装完成后,打开Anaconda prompt并输入jupyternotebook*。

*Jupyter Notebook: 是一个基于Web的交互式计算环境,用于创建jupyter notebook文档。

f603918fa0ec08fa1a2c84ad62f2356b55fbdaaa.jpeg?token=153a155df46729f74b31632b64361151&s=0D62EA02CBE8B2490CFDF5030100C0C1Anaconda prompt

你会看到一个和下图一样的窗口:

b3119313b07eca8064f02cedaf3f9fdba04483e0.jpeg?token=c70876b909182e39c30c7d2665559ae1&s=08285D324B2267244AD521DB0300E0B1Jupyter Notebook文件查找器

现在,已经知道如何将anaconda应用到python里了,继续研究如何在anaconda里为不同的项目导入数据库。

导入Python库至Anaconda

打开Anaconda prompt,检查数据库是否已经安装。

72f082025aafa40f9b862ee5ef780b4978f0196c.jpeg?token=795accfe412b650fa028f6fc7a1972f9检查NumPy*是否安装

*NumPy是Python语言的一个扩展程序库,支持高端大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

因为没有名为numpy的模块存在,我们要运行以下指令来安装numpy。

728da9773912b31be43c90e5c3043e7cdbb4e148.jpeg?token=6198b229e0463f8b8074640b294539d0&s=4562B94245FB26201CF0C007030010C3安装NumPy中

安装完成,就会出现这样一个窗口:

8c1001e93901213f027108231cfb3ed72e2e95b5.jpeg?token=c2f7bedafe874269a1cd8acb54c04773&s=4D62BA4209A9B6495C75280F0100C0C1NumPy安装完成

安装完一个数据库后,尽量再次导入模块以验证安装是否成功。

fcfaaf51f3deb48f5b7df2a1bd03322f2df5785f.jpeg?token=a473f267c68a487c4d8f4ef815beed83&s=0CF2EA02CBBEB6491ED5AD0E010080C3导入NumPy

如上图所示,这一步没有出现错误。这就是在Anaconda中安装不同数据库的方法。

Anaconda Navigator

34fae6cd7b899e5119ab78bf12bbd135c8950d11.jpeg?token=a00a52858c0f4f39742f3eb984b53075&s=0130E8329B0B414956DC81DA0300C0B1Anaconda Navigator

Anaconda Navigator是Anaconda发行版附带的桌面图形用户界面(GUI),它能够让用户在不使用命令行的情况下启动应用程序,并管理conda软件包和环境。

94cad1c8a786c917ec51ae3b9e2178c93bc75700.jpeg?token=0e9bcbb9684fc8224240e0fd06596b7f

Python基础

a1ec08fa513d2697fe9a130e00e7bafd4316d83e.jpeg?token=c6d1e0b7f584a9563742aabe394d3fe4&s=7902E41EE603C90B086D78520300D0F0变量和数据类型

变量和数据类型是所有编程语言的基本组成部分。基于不同数据的属性,Python共有六种数据类型。其中,列表(list),字典(dictionary),集合(set),还有元组(tuple)是Python中的集合数据类型。

下面是变量和数据类型在Python中应用的例子:

#variable declaration

name = "Edureka"

f = 1991

print("python wasfounded in" , f)

#data types

a = [1,2,3,4,5,6,7]

b = {1 : 'edureka' , 2: 'python'}

c = (1,2,3,4,5)

d = {1,2,3,4,5}

print("the listis" , a)

print("thedictionary is" ,b)

print("the tupleis" , c)

print("the set is" , d)

操作符(Operators)

Python 中的操作符用于值或变量之间的操作。Python中有七种类型的操作符:

赋值操作符(AssignmentOperator)。算术运算符(ArithmeticOperator)。逻辑运算符(LogicalOperator)。比较操作符(ComparisonOperator)。位操作符(Bit-wiseOperator)。会员操作符(MembershipOperator)。身份识别操作符(Identity Operator)。

下面是在Python中使用操作符的一个例子:

a = 10

b = 15

#arithmetic operator

print(a + b)

print(a - b)

print(a * b)

#assignment operator

a += 10

print(a)

#comparison operator

#a != 10

#b == a

#logical operator

a > b and a > 10

#this will return true if both the statements are true.

控制语句

诸如使用if, else, break和continue等的语句被用作控制语句,以获得对执行过程的控制,从而取得最佳结果。可以在 Python 的循环中使用这些语句来控制结果。下面的示例演示如何使用控制(control)条件(conditional)语句。

name = 'edureka'

for i in name:

if i == 'a':

break

else:

print(i)

函数

Python函数以一种高效的方式使代码的重复使用性提高,为问题语句编写逻辑,并运行一些参数以获得最佳解决方案。下面是如何在python中使用函数的示例。

deffunc(a):

return a ** a

res = func(10)

print(res)

类以及对象

因为Python支持面向对象的程序设计,所以也可以使用类和对象。下面是如何使用python中的类和对象的示例。

classParent:

deffunc(self):

print('this is parent')

classChild(Parent):

deffunc1(self):

print('this is child')

ob = new Child()

ob.func()

以上Python的一些基本概念。接下来,看看Anaconda更大的软件包支持,我们可以从许多库中获得资料。现在来探究如何使用 python anaconda进行数据分析。

94cad1c8a786c917ec51ae3b9e2178c93bc75700.jpeg?token=0e9bcbb9684fc8224240e0fd06596b7f

分析

f31fbe096b63f624f70a45e6dd58e3fe1b4ca3a6.jpeg?token=b17de094f77f3b017887ad38879653f6&s=51332C725832C68AC0CC19520300C0F0数据挖掘和分析工作流

上面是数据分析中涉及的某些步骤。来看看在anaconda中数据分析是如何进行数据分析的,以及其中可以使用的各种库。

收集数据

数据的收集就像在程序中加载 CSV 文件一样简单。可以利用相关数据来分析数据中的特定实例或条目。下面是加载程序中CSV数据的代码:

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

df = pd.read_csv('filename.csv')

print(df.head(5))

37d3d539b6003af3556761e26836ce5a1138b671.jpeg?token=55f5382f0c222248b40fb83a73d3f41d&s=15B07D32C562552052EC15CA030070B3前五行数据组

交叉分析

在加载程序中的数据集之后,还需要对数据进行一些更改过滤,即消除空值和可能造成分析不确定性的不必要字段。

下面是如何根据需求筛选数据的示例:

print(df.isnull().sum())

#this will give the sum of all the null values in thedataset.

df1 = df.dropna(axis=0 , how= 'any')

#this will drop rows with null values

ae51f3deb48f8c54539d958a653525f3e1fe7fef.jpeg?token=03e3de1dd56d0cbf3a40613bdb08414e&s=2598ED3213C05D4B0EF5EDDA0300D0B3找到每列空值的总数

当然也可以删除空值。

5ab5c9ea15ce36d33b70b60459ef3281e950b1b4.jpeg?token=cd1d3dba955560a14c0572cc730efd89&s=259AEC3309D04DCA0EF5E0D60300C0B3删除空值的所在行

箱线图(box plot)

sns.boxplot(x=df['Salary Range From'])

sns.boxplot(x=df['Salary Range To'])

2fdda3cc7cd98d102edce4344723b0087bec9049.jpeg?token=4e8dfd7ebbeb6e8fead46148942320ff&s=39A87C3351A445099E7164D6030090B0薪资范围箱线图

c83d70cf3bc79f3df94f9fc4d0bdc517738b29bd.jpeg?token=6318d076e0f3814013b1cd95731ca6da&s=11B06C33977741880C4820DA030010B0薪资范围箱线图

散点图(scatter plot)

import matplotlib.pyplot as plt

fig, ax = plt.subplots(figsize=(16,8))

ax.scatter(df['Salary Range From'] , df['Salary Range To'])

ax.set_xlabel('Salary Range From')

ax.set_ylabel('Salary Range TO')

plt.show()

c8ea15ce36d3d539090d1c49579be156352ab02e.png?token=812d0e6bbc0ac63c1094074e5c4c1db9&s=782A1C72135049C6546864D60300C0B2薪资范围散点图

可视化

一旦根据需求改变了数据,就有必要分析这些数据,方式之一就是将结果可视化。更好的可视化表示有助于对数据投影进行最优分析。

下面是一个数据可视化的例子:

3ac79f3df8dcd100fc74cb971d974f16b8122fb9.jpeg?token=a8cc92dfb6f4abe23b4d5dab0bd38e99&s=31306C3314A4C70D9EF365D60300C0E2全职&兼职工作者的柱状图

3ac79f3df8dcd1009669d11d01974f16b9122f32.jpeg?token=562296d59ccf7a8b33ffaad242b78731&s=311A4C331BF848090C4031DA0300C0B2全职&兼职工作者及工资结算方式柱状图

bba1cd11728b47100e5f5bb5b6d2cbfbfc03237d.jpeg?token=84639e8962fae607b6b7cada3cd4a786&s=392A7C330565C30912F160D7030010A2薪资范围直方图

dbb44aed2e738bd49ac5ef30d9978fd0267ff9e9.jpeg?token=8be691040c65841e11b570f6d22cd576&s=31127C334037C38813F364D7030010E0薪资范围直方图

import matplotlib.pyplot as plt

fig = plt.figure(figsize = (10,10))

ax = fig.gca()

sns.heatmap(df1.corr(), annot=True, fmt=".2f")

plt.title("Correlation",fontsize=5)

plt.show()

78310a55b319ebc4137a962ef93ac7fa1e17162d.jpeg?token=26560fab72f10f0653699ba54a3dd1a0&s=50B2A872C2AB16BA1C9FBABE0300F02E用matplotlib绘制的热图

分析

完成可视化后,可以借助各种图表来进行分析。假设我们正在处理作业数据,通过查看某个区域中特定作业的可视化表示,便可以确定特定域中作业的数量。

根据上文的分析,可以假设下列结果:

和全职工作相比,数据集里兼职工作的数量非常少。兼职工作只有不到500个,但全职工作的总数超过了2500个。基于这一分析,可以建立一个预测模型。

如果还有其他问题,在评论区里踊跃发言哟,小芯将第一时间与你联系。

f1ec64a630324daa3c5dbef14a6416483806.gif

2934349b033b5bb5cbb8de01b7cfdd3fb700bc80.jpeg?token=2692cb8731cbf631108910f0501d4fcd

留言点赞关注

我们一起分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值