自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

翻译 Python数据类型转换及描述

主要学习如何了解数据,例如读入数据的模块如何,各个变量都属于什么数据类型,一些重要的统计指标对应的值是多少,离散变量唯一值的频次如何统计等等。# 数据类型转换及描述统计# 数据读取sec_cars = pd.read_table(r'C:\Users\LENOVO\Desktop\sec_cars.csv', sep = ',')# 预览数据的前五行sec_cars.head()# 查看数据的行列数print('数据集的行列数:\n',sec_cars.shape)# 查看数据集每个变量的数

2021-03-27 22:12:13 314

原创 运行代码pymysq总报错,求大神指教

我已经安装了最新的pip,安装了pymysql,一运行就报错,我查了好多都没有可以解决这个问题的方法。有没有大神可以帮帮我,感激不尽。

2021-03-27 10:30:39 161

原创 Python外部数据的读取

在实际工作中,更多的情况是通过Python读取外部数据集,这些数据集可能包含在本地的本文文件(如csv、txt等)、电子表格Excel和数据库中(如MySQL、SQL Server等)。现在学习是如何基于pandas模块实现文本文件、电子表格和数据库数据的读取。文本文件的读取要读取txt和csv格式中的数据 ,可以使用pandas模块中的read_table函数或read_csv函数。而并不是说每个函数只能读取一种格式的数据,而是这两种函数均可以文本文件的数据。由于两种函数功能和参数使用上类似,因此这里

2021-03-26 22:19:07 865

原创 Python数据处理 pandas

接下来开始学习Python的另一个常用模块,强大的数据处理模块pandas,这个模块可以帮助数据分析师轻松解决数据预处理的问题,如数据类型的转换、缺失值的处理、描述性统计分析、数据的汇总等。首先学习序列与数据框的构造,pandas模块的核心操作对象就是序列和数据框,序列可以理解为一个数据集中的一个字段,数据框是指含有至少两个字段(或序列)的数据集。构造序列构造序列可以通过以下方式实现:1.通过同质的列表或者元组实现2.通过字典构建3.通过numpy中的一维数组构建4.通过数据框DataFram

2021-03-24 12:08:31 230 1

原创 Python 伪随机数的生成

推荐使用numpy模块中的子模块random为了直观展示分布函数的概率密度曲线,以正态分布和指数分布为例。import seaborn as snsimport matplotlib.pyplot as pltfrom scipy import stats# 生成各种正态分布随机数np.random.seed(1234)rn1 = np.random.normal(loc = 0, scale = 1, size = 1000)rn2 = np.random.normal(loc = 0,

2021-03-23 18:26:01 536

原创 Python 线性代数的相关计算

介绍numpy模块解决各种线性代数相关的计算,需要调用numpy的子模块linalg,该模块几乎提供了线性代数所需的所有功能。np.zeros 生成零矩阵np.eye 生成单位矩阵np.dot 计算两个数组的点积np.diag 矩阵主对角线与一维数组间的转换np.linalg.det 计算矩阵行列式np.linalg.eigvals 计算矩阵特征根np.linalg.pinv 计算方阵的Moore-Penrose伪逆np.linalg.lstsq 计算ax=b的最小二乘解n

2021-03-23 17:25:12 485

原创 python数组的基本运算符

四则运算math = np.array([98,83,86,92,67,82])english = np.array([68,74,66,82,75,89])chinese = np.array([92,83,76,85,87,77])tot_symbol = math+english+chinesetot_fun = np.add(np.add(math,english),chinese)print('符号加法:\n',tot_symbol)print('函数加法:\n',tot_fun)

2021-03-20 17:01:50 770

翻译 python数值计算------数组的创建与操作

通过numpy模块中的array函数实现数组的创建,构成数组的元素都是同质的,即数组中的每一个值都具有相同的数据类型。数组的创建# 导入模块,并重命名为npimport numpy as np# 单个列表创建一维数组arr1 = np.array([3,10,8,7,34,11,28,72])# 嵌套元组创建二维数组arr2 = np.array(((8.5,6,4.1,2,0.7),(1.5,3,5.4,7.3,9),(3.2,3,3.8,3,3),(11.2,13.4,15.6,17.8,

2021-03-19 15:58:17 669

翻译 python自定义函数

在Python中有一种自定义函数为匿名函数,可以用lambda关键字定义。通过lambda构造的函数可以没有名称,最大的特点是在自定义匿名函数时所有代码只能在一行内完成,语法如下:lambda parameters : function_expressionlambda为匿名函数的关键起始词;parameters是函数可能涉及的形参,如果有多个参数,需要用英文状态的逗号隔开;function_expression为具体的函数体。如果构造的函数不是很复杂就用lambda匿名函数一气呵成,否则就只能使用d

2021-03-18 16:25:14 165

翻译 python正则表达式

正则表达式是从字符串中发现规律,并通过“抽象”的符号表达出来。常用的正则符号:. #可以匹配任意字符,但不包含换行符\n\ #转义符,一般用于保留字符串中的特殊元字符| #逻辑或[] #用于匹配的一组字符\d与\D #\d匹配任意数字,\D代表所有非\d\s与\S #\s匹配任意空白字符,\S代表所有非\s\w与\W #\w匹配字母或下划线,\W代表所有非\w* #匹配前一个字符0到无穷次+ #匹配前一个字符1到无穷次? #匹配前一个字符0到1次{m} #匹配前一个字符m次{m,n

2021-03-17 10:10:50 76

翻译 Python字符串处理方法

构造字符串可以使用三种形式的引号,如果字符串的内容不包含任何引号,那么单引号、双引号和三引号都可以使用;展示如下实例:# 单引号构造字符串string1 = '"commentTime":"2018-01-26 08:59:30","content":"包装良心!馅料新鲜!还会回购"'# 双引号构造字符串string2 = "ymd:'2017-01-01',bWendu:'5℃',yWendu:'-3℃',tianqi:'霾~晴',fengxiang:'南风',aqiInfo:'严重污染'"#

2021-03-16 17:00:05 109

原创 Python元组和字典

元组元组与列表相似,元组通过英文状态下的圆括号构成即(),其存放的元素与列表一样,可以是不同的数值类型,也可以是不同的数据结构。元组仍然是一种序列,与几种获取列表元素的索引方法相同。然而与列表最大的区别就是,元组不再是一种可变类型的数据结构。由于元组只是存储数据的不可变容器,因此其只有两种可用的方法,分别是count和index,功能与列表中的一样。字典字典是一种非常常用的一种数据结构,它与json格式的数据非常相似,核心就是以键值对的形式存储数据,关于Python中的字典有如下说明:1、构造

2021-03-15 10:43:52 396

原创 python基础与数据挖掘

数据挖掘的流程:明确目标,数据搜集,数据清洗,构建模型,模型评估,应用部署。列表说明:(1)列表的构造是通过英文状态下的[]完成的,可以将每一个元素存放在中括号中,而且列表中的元素是不受任何限制的,可以存放数值、字符串以及其他数据结构的内容。(2)列表是一种序列,即每个列表元素是按照顺序存入的,这些元素都有一个属于自己的位置。(3)列表是一种可变类型的数据结构,即可以实现对列表的修改,包括增加、删除和修改列表中的元素值。在Python中的位置索引都是从0开始的。接下来通过具体例子介绍:正向单

2021-03-14 17:43:36 157

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除