大家好,本文将围绕大学生python心得体会1500字展开说明,大学生python心得体会是一个很多人都想弄明白的事情,想搞清楚python总结报告怎么写需要先了解以下几个事情。
目录
一.数据分析
Python是一种广泛使用的编程语言,它具有简洁、优雅、易读的语法,以及丰富的第三方库,特别适合进行数据分析与应用。在这篇博客中,我将分享一些我在使用Python进行数据分析与应用时的心得和经验,以及一些常用的代码示例python基础知识点总结图解。
数据分析是指从数据中提取有价值的信息,以支持决策或发现规律。数据分析的过程通常包括以下几个步骤:
- 数据获取:从不同的来源获取数据,如文件、数据库、网络、API等。
- 数据清洗:对数据进行预处理,如去除缺失值、异常值、重复值等,以提高数据的质量和可用性。
- 数据探索:对数据进行描述性统计、可视化、聚类等,以了解数据的基本特征和分布。
- 数据建模:根据分析目的,选择合适的模型和算法,如回归、分类、聚类、关联规则等,以从数据中学习和预测。
- 数据评估:对模型的性能和效果进行评估和优化,如准确率、召回率、AUC等,以提高模型的泛化能力和可信度。
- 数据呈现:将分析结果以图表、报告、仪表盘等形式展示给用户或决策者,以支持决策或传达信息。
Python提供了许多强大的第三方库来支持数据分析与应用,如NumPy、Pandas、Matplotlib、Seaborn、Scikit-learn等。下面我将介绍一些我常用的库和代码示例。
二.NumPy
NumPy是一个用于科学计算的库,它提供了高效的多维数组对象和相关操作,如数组创建、索引、切片、运算等。NumPy数组是Python数据分析的基础,它可以与其他库无缝协作。以下是一些NumPy的代码示例:
# 导入NumPy库
import numpy as np
# 创建一维数组
a = np.array([1, 2, 3, 4, 5])
print(a)
# [1 2 3 4 5]
# 创建二维数组
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(b)
# [[1 2 3]
# [4 5 6]
# [7 8 9]]
# 获取数组的形状
print(a.shape)
# (5,)
print(b.shape)
# (3, 3)
# 获取数组的元素个数
print(a.size)
# 5
print(b.size)
# 9
# 获取数组的元素类型
print(a.dtype)
# int32
print(b.dtype)
# int32
# 修改数组的形状
c = a.reshape(1, 5)
print(c)
# [[1 2 3 4 5]]
d = b.reshape(9,)
print(d)
# [1 2 3 4 5 6 7 8 9]
# 数组的索引和切片
print(a[0]) # 获取第一个元素
# 1
print(b[1,2]) # 获取第二行第三列的元素
# 6
print(a[1:4]) # 获取第二个到第四个元素(不包括第四个)
# [2 3 4]
print(b[:2,:2]) # 获取前两行前两列的元素
# [[1 2]
# [4 5]]
# 数组的运算
e = np.array([6,7,8,9,10])
f = a + e # 数组的加法
print(f)
# [ 7 9 11 13 15]
g = b * 2 # 数组的乘法
print(g)
# [[ 2 4 6]
# [ 8 10 12]
# [14 16 18]]
h = np.dot(b, g) # 数组的点积
print(h)
# [[ 60 72 84]
# [132 162 192]
# [204 252 300]]
# 数组的广播
i = np.array([1,2,3])
j = b + i # 数组的形状不同,但可以进行加法,因为i会被扩展为[[1,2,3],[1,2,3],[1,2,3]]
print(j)
# [[ 2 4 6]
# [ 5 7 9]
# [ 8 10 12]]
三. 掌握pyplot基础语法
1.创建画布与创建子图
主要作用是构建出一张空白的画布,可以选择是否将整个画布划分为多个部分,方便在同一个图上绘制多个图形。当只需要绘制一个简单的图形时,这部分内容可以省略。 在pyplot中,创建画布以及创建并选择子图的函数/方法,其中各类函数和方法中的matplotilb.pyploy简写为plt,如下表。
创建画布与创建并选中子图的常用函数/方法及其作用
2. 添加画布内容
添加标题、添加坐标轴名称、绘制图形等步骤是并列的,是没有先后顺序的,可以先绘制图形,也可以先添加各类标签。但是添加图例一定要在绘制图形之后。在pyplot 中添加各类标签和图例的常用函数及其作用如表
添加各类标签和图例的常用函数及其作用
3. 保存与显示图形
在pyplot中,添加各类标签和图例的常用函数,如下表
保存与显示图形的常用函数及其作用
较简单的绘图可以省略第一部分,然后直接在默认的画布上进行图形绘制,代码1-1 基础绘图语法
import numpy as np
import matplotlib.pyplot as plt
# %matplotlib inline表示在行中显示图片,在命令行运行报错
data = np.arange(0, 1.1, 0.01)
plt.title('lines') # 添加标题
plt.xlabel('x') # 添加x轴的名称
plt.ylabel('y') # 添加y轴的名称
plt.xlim((0, 1)) # 确定x轴范围
plt.ylim((0, 1)) # 确定y轴范围
plt.xticks([0, 0.2, 0.4, 0.6, 0.8, 1]) # 规定x轴刻度
plt.yticks([0, 0.2, 0.4, 0.6, 0.8, 1]) # 确定y轴刻度
plt.plot(data, data ** 2) # 添加y=x^2曲线
plt.plot(data, data ** 4) # 添加y=x^4曲线
plt.legend(['y=x^2', 'y=x^4'])
plt.savefig('../tmp/y=x^2.jpg') #图片保存路径
plt.show()
代码1-1是一个简单的不含子图绘制的标准绘图流程的示例。子图绘制本质上是多个基础图形绘制过程的叠加,即分别在同一幅画布的不同子图上绘制图形,如代码1-2 包含子图绘制的基础语法
x = np.arange(0, np.pi * 2, 0.01)
# 第一幅子图
p1 = plt.figure(figsize=(8, 6), dpi=80) # 确定画布大小
# 创建一个2行1列的子图,并开始绘制第一幅
ax1 = p1.add_subplot(2, 1, 1)
plt.title('lines') # 添加标题
plt.xlabel('x') # 添加x轴的名称
plt.ylabel('y') # 添加y轴的名称
plt.xlim((0, 1)) # 确定x轴范围
plt.ylim((0, 1)) # 确定y轴范围
plt.xticks([0, 0.2, 0.4, 0.6, 0.8, 1]) # 规定x轴刻度
plt.yticks([0, 0.2, 0.4, 0.6, 0.8, 1]) # 确定y轴刻度
plt.plot(x, x ** 2) # 添加y=x^2曲线
plt.plot(x, x ** 4) # 添加y=x^4曲线
plt.legend(['y=x^2', 'y=x^4'])
# 第二幅子图
ax2 = p1.add_subplot(2, 1, 2) # 开始绘制第二幅
plt.title('sin/cos(x)') # 添加标题
plt.xlabel('x') # 添加x轴的名称
plt.ylabel('y') # 添加y轴的名称
plt.xlim((0, np.pi * 2)) # 确定x轴范围
plt.ylim((-1, 1)) # 确定y轴范围
plt.xticks([0, np.pi / 2, np.pi, np.pi * 1.5, np.pi * 2]) # 规定x轴刻度
plt.yticks([-1, -0.5, 0, 0.5, 1]) # 确定y轴刻度
plt.plot(x, np.sin(x)) # 添加sin(x)曲线
plt.plot(x, np.cos(x)) # 添加cos(x)曲线
plt.legend(['y=sin(x)', 'y=cos(x)'])
plt.tight_layout() # 调整两个子图间距
plt.savefig('../tmp/sincos(x).jpg') #图片保存路径
plt.show()
四. 设置pyplot的动态rc参数
-
pyplot使用rc配置文件来自定义图形的各种默认属性,被称为rc配置或rc参数。
-
在 pyplot中,几乎所有的默认属性都是可以控制的,如窗口大小、线条宽度、颜色与样式、坐标轴、网格属性、文本、字体等。
-
所有存储在字典变量中的rc参数,都被称为rcParams。
绘图时默认使用的参数就会发生改变。线条rc参数修改前后对比如代码2-1 线条rC参数修改前后对比
# 原图
x = np.linspace(0, 4 * np.pi) # 生成x轴数据
y = np.sin(x) # 生成y轴数据
plt.plot(x, y, label='$sin(x)$') # 绘制sin曲线图
plt.title('sin(x)')
plt.xlabel('x')
plt.ylabel('y')
plt.show()
# 修改rc参数后的图
plt.rcParams['lines.linestyle'] = '-.'
plt.rcParams['lines.linewidth'] = 3
plt.plot(x, y, label='$sin(x)$') # 绘制三角函数
plt.title('sin(x)')
plt.xlabel('x')
plt.ylabel('y')
plt.show()
在pyplot中,线条中常用的rc参数名称、解释与取值如下表。lines.linestyle参数取值及其意义
lines.marker参数取值及其意义
由于默认的pyplot字体并不支持中文字符的显示,因此需要通过设置font.sans-serif参数来改变绘图时的字体,使得图形可以正常显示中文。同时,由于更改字体后,会导致坐标轴中的部分字符无法显示,因此需要同时更改axes.unicode_minus参数,如代码2-1 调节字体的rc参数
# 无法显示中文标题
plt.plot(x, y, label='$sin(x)$') # 绘制三角函数
plt.title('sin(x)曲线')
plt.xlabel('x')
plt.ylabel('y')
plt.show()
# 设置rc参数显示中文标题
# 设置字体为SimHei显示中文
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False # 设置正常显示符号
plt.plot(x, y, label='$sin(x)$') # 绘制三角函数
plt.title('sin(x)曲线')
plt.xlabel('x')
plt.ylabel('y')
plt.show()
除了有设置线条和字体的r参数外,还有设置文本、坐标轴、图例、标记、图片、的像保存等的rc参数。具体参数与取值可以参考官方文档。
五.使用Matplotlib绘制进阶图形
1. 绘制散点图
Ø 在pyplot中,绘制散点图的函数为scatter,scatter函数的常用参数及其说明,如下表。
2. 绘制折线图
Ø 折线图(Line Chart)是一种将数据点按照顺序连接起来的图形,可以看作是将散点图按照x轴坐标顺序连接起来的图形。
Ø 在pyplot中绘制折线图的函数为plot,plot函数常用参数及其说明如下表。
Ø 其中color参数的8种常用颜色的缩写如下表。
3. 绘制柱形图
pyplot中绘制柱形图的函数为bar,bar函数的常用参数及其说明如下表。