python数据分析0基础--学习掌握---附链接

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


工具介绍:

1. 解释器: python

Python是一种高级编程语言, 数据分析库如Numpy、Pandas、Matplotlib等,使得Python成为了数据科学领域的主流工具。

2. pycharm

PyCharm是由JetBrains公司开发的一款专门为Python语言开发的集成开发环境(IDE),它是一个功能强大、易于使用的编辑器,支持很多先进的功能和工具以提高Python的开发效率。

PyCharm提供了代码自动完成、错误检查、重构、调试和版本控制等功能,支持Django、Flask、Pyramid等常用的Web框架,能够帮助开发人员更快、更容易地撰写高质量的Python代码。

此外,PyCharm还有很多插件和定制设置,可以更好地满足用户的各种需求。总之,PyCharm是Python开发者不可或缺的开发工具之一。

什么是数据分析

数据分析是指使用各种技术和工具对数据进行系统性的评估和解释,以提取有用的信息和洞察,并支持决策和预测。数据分析通常包括数据清洗、数据整合、数据建模、数据可视化等步骤,旨在从大量数据中提取出可操作的信息,用于帮助企业或组织做出更明智的战略决策。数据分析在许多领域中都有广泛的应用,包括商业、金融、医疗保健、教育、科学等等。

数据分析常用的库

1.NumPy:处理数值计算的库,支持多维数组和矩阵计算。
2.Pandas:用于数据处理、分析和清洗的库,可以轻松地对数据进行操作、处理和统计。
3.Pandas:用于数据处理、分析和清洗的库,可以轻松地对数据进行操作、处理和统计。
4.SciPy:一个基于 NumPy 的科学计算库,包括统计学、优化、数值积分和线性代数等子库。
5.Scikit-learn: 机器学习的库,包括分类、回归、聚类、降维和模型选择等功能。
6.TensorFlow:一个用于构建和训练神经网络的库,由 Google 开发。
7.PyTorch:一个用于构建深度神经网络的库,由 Facebook 开发。

数组的属性以及其说明

属性名称属性说明
ndim返回int。表示数组的维数
shape返回tuple。表示数组形状,对于n行m列的矩阵,形状为(n,m)
size返回 int。表示数组的元素总数,等于数组形状中各元素的积
dtype返回data-type。表示数组中元素的数据类型
itemsize返回int。表示数组的每个元素的存储空间(以B为单位)。例如,一个元素类型为float64的数组的itemsize属性值为8(float64占用64bit,1B为 8bit,所以float64,占用8B一个元素类型为complex32的数组的 itemsize属性值为4

array函数的主要参数说明

参数名称属性说明
object接收array _like。表示所需创建的数组对象。无默认值
dtype接收 data-type。表示数组所需的数据类型,如果未给定,那么选择保存对象所需的
ndmin接收int。用于指定生成数组应该具有的最小维数。默认为0

基础代码-创建一维数组并查看数组的信息内容

import numpy as np  # 导入NumPy库 
arr1 = np.array([1, 2, 3, 4])  # 创建一维数组 
print(' 创建的数组为: ', arr1)

# 创建二维数组
arr2 = np.array([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]])
print('创建的数组为:\n', arr2)

print('数组维度为:', arr2.shape)  # 查看数组结构
print('数组类型为:', arr2.dtype)  # 查看数组类型
print('数组元素个数为:', arr2.size)  # 查看数组元素个数
print('数组每个元素大小为:', arr2.itemsize)  # 查看数组每个元素大小

数组的部分属性:

1.重新设置数组的shape属性。

arr2.shape = 4,3  # 重新设置shape
print('重新设置shape 后的arr2 为:\n', arr2)

2.arange函数创建数组。

print('使用arange函数创建的数组为:\n', np.arange(0,1,0.1))

3.logspace函数创建等比数列

print('使用logspace函数创建的数组为:\n', np.logspace(0, 2, 20))

4.zeros函数创建数组

print('使用zeros函数创建的数组为:\n', np.zeros((2,3)))

5.eye函数创建数组

print('使用eye函数创建的数组为:\n', np.eye(3))

数组的数据类型转换

NumPy的基础数据类型以及取值范围

类型描述
bool用1位存储的布尔值(值为 True或False )
inti表示由所在平台决定其精度的教数(-船为int32或int64)
int8表示整数,范围为-128~127
int16表示整数,范围为-32768~32767
int32表示整数,范围为-23~23-1
int64表示整数,范围为-263~2 63-1
uint8表示无符号整数,范围为0~255
uint16表示无符号整数,范围为0~65535
uint32表示无符号整数,范围为0~232-1
uint64表示无符号整数,范围为0~24-1

1.转换类型是我们数据分析的最基础的,为了更好的帮助理解数据类型。

print('转换结果为:', np.float64(42))  # 整型转换为浮点型
print('转换结果为:', np.int8(42.0))  # 浮点型转换为整型
print('转换结果为:', np.bool(42))  # 整型转换为布尔型
print('转换结果为:', np.bool(0))  # 整型转换为布尔型
print('转换结果为:', np.float(True))  # 布尔型转换为浮点型
print('转换结果为:', np.float(False))  # 布尔型转换为浮点型

数组的索引

为了更好的了解到我们数据的个体以及部分内容,我们采用数组的索引,进行对数据的查看,以及修改等,接下来 给大家进行代码展示数组的索引。
arr = np.arange(10)
print('索引结果为:', arr[5])  # 用整数作为下标可以获取数组中的某个元素

# 用范围作为下标获取数组的一个切片,包括arr[3]不包括arr[5]
print('索引结果为:', arr[3:5])

print('索引结果为:', arr[:5])  # 省略开始下标,表示从arr[0]开始

# 下标可以使用负数,-1表示从数组后往前数的第一个元素
print('索引结果为:', arr[-1])

arr[2:4] = 100,101
print('索引结果为:', arr)  # 下标还可以用来修改元素的值

# 范围中的第三个参数表示步长,2表示隔一个元素取一个元素
print('索引结果为:', arr[1:-1:2])

print('索引结果为:', arr[5:1:-2])  # 步长为负数时,开始下标必须大于结束下标
多维数组的索引
arr = np.array([[1, 2, 3, 4, 5],[4, 5, 6, 7, 8], [7, 8, 9, 10, 11]])
print('创建的二维数组为:\n', arr)

print('索引结果为:', arr[0,3:5])  # 索引第0行中第3和第4列的元素

# 索引第2和第3行中第3列、第4列和第5列的元素
print('索引结果为:\n', arr[1:,2:])

print('索引结果为:', arr[:,2])  # 索引第2列的元素
使用整数序列索引和布尔值索引访问多维数组
# 从两个序列的对应位置取出两个整数组成下标:arr[0,1], arr[1,2], arr[2,3]
print('索引结果为:', arr[[(0, 1, 2), (1, 2, 3)]])
print('索引结果为:', arr[1:, (0, 2, 3)])  # 索引第23行中第023列的元素

mask = np.array([1, 0, 1], dtype = np.bool)
# mask是一个布尔数组,它索引第13行中第2列的元素
print('索引结果为:', arr[mask, 2])

总结

链接:https://pan.baidu.com/s/1RJWYJfN5SFSzIzn3eB8mYw?pwd=hwl6
提取码:hwl6
这只是部分python数据分析的基础知识,要多次手动尝试去学习才能够进阶的了解python学习内容。

今天就分享到这里,谢谢大[添加链接描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值