![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据挖掘与分析
文章平均质量分 65
岁月辰星
.NET研发工程师
展开
-
8. Python数据处理工具——Pandas
Pandas模块可以解决数据的预处理问题,如数据类型的转换、缺失值的处理、描述性统计分析、数据的汇总等。 本章学习的重点 两种重要的数据结构,即序列和数据框。 如何读取外部数据(如文本文件、电子表格或数据库中的数据)。 数据类型转换及描述性统计分析。 字符型与日期型数据的处理。 常见的数据清洗方法。 如何应用iloc、loc与ix完成数据子集的生成。 实现Excel中的透视表操作。 多表之间的合并和连接。 数据集的分组和聚合操作。 序列和数据框的构造 Pandas模块的核心操作对象就是序列(Series原创 2021-01-29 13:27:42 · 233 阅读 · 0 评论 -
7. 伪随机数的生成
虽然Python内置的random模块中可以生成随机数,但是每次只能随机生成一个随机数,但是每次只能随机生成一个数字,而且随机数的种类也不够丰富。 函数 说明 seed(n) 设置随机种子 beta(a,b,size=None) 生成贝塔分布随机数 chiquare(df,size=None) 生成卡方分布随机数 choice(a,size=None,replace=True,p=None) 从a中有放回的随机挑选指定数量的样本 exponential(scale=1.0,s原创 2021-01-29 13:27:10 · 602 阅读 · 0 评论 -
6. 线性代数的相关计算
numpy模块可以解决各种线性代数相关的计算,只不过需要调用Numpy的子模块linalg,该模块几乎提供了线性代数所需的所有功能。 函数 说明 函数 说明 np.zeros 生成零矩阵 np.eye 生成单位矩阵 np.dot 计算两个数组的点积 np.diag 矩阵主对角线与一维数组间的转换 np.linalg.det 计算矩阵行列式 np.linalg.eigvals 计算方阵特征根 np.linalg.pinv 计算方阵的Moore-Penrose伪逆 np.linalg原创 2021-01-29 13:26:58 · 967 阅读 · 0 评论 -
5. 数组的基本运算
Numpy模块中可以实现数组的基本运算。 #加法运算 math = np.array([12,34,23,56,78,34]) english = np.array([56,67,23,45,12,67]) chinese = np.array([1,2,4,5,23,12]) sum_result1 = math + english + chinese sum_result2 = np.add(np.add(math,english),chinese) print('符号加法:',sum_result1)原创 2021-01-29 13:26:49 · 1025 阅读 · 0 评论 -
4. Python数值计算工具 Numpy
Numpy模块 数组的创建与操作 数组的基本数学运算 常用数学和统计函数 线性代数的求解 伪随机数的创建 4.1 数组的创建和操作 数组的创建 #导入模块,并重命名为np import numpy as np #单个列表 创建一位数组 arr1 = np.array([1,34,6,87,3,56,8,23,4]) #嵌套元素创建二维数组 arr2 = np.array(((2,4,2,45.7,6),(7,4,6,8,3),(1,2,34,4,5),(7,8,98,5,23))) print('一维数原创 2021-01-29 13:26:33 · 196 阅读 · 0 评论 -
3.自定义函数
用一个自定义的猜数字函数来说明自定义函数怎么写。 #自定义函数 def game(min,max): import random number = random.randint(min, max) #产生一个需要猜的数字 while True: guess = float(input("请在%d到%d之间才一个数字:"%(min,max))) #if 分至判断下一轮应在什么范围内猜数字 if guess < number:原创 2021-01-29 13:26:24 · 164 阅读 · 0 评论 -
2.Python 控制流 + 字符串处理方法
2. 控制流 2.1 if分支 score = int(input("请输入你的分数:")) if score == 100: print("恭喜你!满分!") elif score >= 90: print("优秀!") else: print("良好") OUT: 请输入你的分数:100 恭喜你!满分! 请输入你的分数:92 优秀! 请输入你的分数:78 良好 2.2 循环 2.1.1 for循环 list = [1,4,2,6,8,9,3,10] result = [原创 2021-01-29 13:26:13 · 297 阅读 · 2 评论 -
1.Python快速入门
1.1 数据结构及方法 1.1.1 列表 列表是一种存储数据的容器。 列表中的元素是不受任何限制的,可以存放数值、字符串及其他数据结构的内容。 列表是一种序列,即每个列表元素是安装顺序存入的。 列表是一种可变类型的数据结构,即可以实现对列表的修改,包括增加、删除和修改列表中的元素值。 “列表是一种序列”指的是可以通过索引(或下标)的方式实现列表元素的获取,Python中的索引都是英文状态下的方括号表示,而且,对于位置索引来说,都是从0开始的。下面有四种常见的索引方式。 1、正向单索引 list1 = [原创 2021-01-29 13:26:01 · 726 阅读 · 4 评论