自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 Python数据分析——Pandas(8)

学习目标目标 应用pd.concat实现数据的合并 应用pd.merge实现数据的合并 应用 无 如果你的数据由多张表组成,那么有时候需要将不同的内容合并在一起分析1 pd.concat实现数据合并pd.concat([data1, data2], axis=1) 按照行或列进行合并,axis=0为列索引,axis=1为行索引 比如我们将刚才处理好的one-hot编码与原数据合并# 按照行索引进行pd.concat([data, dummies], .

2021-12-06 22:11:23 279 2

原创 Python数据分析——Pandas(7)

学习目标目标 应用cut、qcut实现数据的区间分组 应用get_dummies实现数据的one-hot编码 应用 找出股票的涨跌幅异动(异常)值 1 为什么要离散化连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具。2 什么是数据的离散化连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数值代表落在每个子区间中的属性值。离散化有很多种方法,这使用一种最简单的.

2021-12-05 14:15:39 318 1

原创 Python数据分析——Pandas(6)

学习目标目标 说明Pandas的缺失值类型 应用replace实现数据的替换 应用dropna实现缺失值的删除 应用fillna实现缺失值的填充 应用isnull判断是否有缺失数据NaN 应用 对电影数据进行缺失值处理 1 如何处理nan 判断数据是否为NaN: pd.isnull(df), pd.notnull(df) 处理方式: 存在缺失值nan,并且是np.nan: 1、删除存在缺失值的:dropna(a..

2021-12-02 14:39:35 391 1

原创 Python数据分析——Pandas(5)

学习目标目标 了解Pandas的几种文件读取存储操作 应用CSV方式和HDF方式实现文件的读取和存储 应用 实现股票数据的读取存储 我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。注:最常用的HDF5和CSV文件1 CSV1.1 read_csvpandas.read_csv(filepath_or_buffer, sep =',' ) fil.

2021-12-01 17:34:50 823 1

原创 Python数据分析——Pandas(4)

学习目标目标 了解DataFrame的画图函数 了解Series的画图函数 应用 股票每日数据的统计 1 pandas.DataFrame.plot DataFrame.plot(x=None,y=None,kind='line') x : 标签或位置,默认为无 y : 标签,位置或标签列表,位置,默认无 允许绘制一列与另一列的对比图 kind : str ‘line’ : 折线图 ‘bar’ : 垂直条形图 ‘barh’ : 水平条形图..

2021-11-30 17:56:12 220

原创 Python数据分析——Pandas(3)

学习目标目标 使用describe完成综合统计 使用max完成最大值计算 使用min完成最小值计算 使用mean完成平均值计算 使用std完成标准差计算 使用cumsum等实现累计分析 应用逻辑运算符号实现数据的逻辑筛选 应用isin实现数据的筛选 应用query实现数据的筛选 应用add等实现数据间的加法运算 应用apply函数实现数据的自定义处理 应用 股票每日数据的统计 1 算术运算add(other)比如进行数学运算加上具体的一个数字

2021-11-29 15:55:41 1084 1

原创 Python数据分析——Pandas(2)

学习目标目标 记忆DataFrame的形状、行列索引名称获取等基本属性 应用Series和DataFrame的索引进行切片获取 应用sort_index和sort_values实现索引和值的排序 应用 股票每日数据的操作 为了更好的理解这些基本操作,我们将读取一个真实的股票数据。有需要的话数据可以从这里下载:股票数据下载# 读取文件data = pd.read_csv("./data/stock_day.csv")# 删除一些列,让数据更简单些,再去做后面的操作dat

2021-11-28 16:45:15 903

原创 Python数据分析——Pandas(1)

学习目标目标 了解Numpy与Pandas的不同 了解Pandas的MultiIndex与panel结构 说明Pandas的Series与Dataframe两种结构的区别 应用 股票涨跌幅数据的修改 1 Pandas介绍2008年WesMcKinney开发出的库 专门用于数据挖掘的开源python库 以Numpy为基础,借力Numpy模块在计算方面性能高的优势 基于matplotlib,能够简便的画图 独特的数据结构2 为什么使用PandasNumpy已经能够

2021-11-27 15:30:50 1167

原创 Python数组——Numpy(6)

学习目标 目标 说明数组间运算的广播机制 知道数组与数之间的运算 知道数组与数组之间的运算 理解矩阵的特点以及运算规则 应用np.matmul实现矩阵运算 应用 学生综合成绩矩阵运算 1 场景数据:[[80, 86],[82, 80],[85, 78],[90, 90],[86, 82],[82, 90],[78, 80],[92, 94]]2 数组与数的运算arr = np.array([[1, 2, 3, 2,

2021-11-26 18:52:12 391

原创 Python数组——Numpy(5)

学习目标目标 知道什么是矩阵和向量 知道矩阵的加法,乘法 知道矩阵的逆和转置 1 矩阵和向量1.1 矩阵矩阵,英文matrix,和array的区别矩阵必须是2维的,但是array可以是多维的。如图:这个是 3×2 矩阵,即 3 行 2 列,如 m 为行,n 为列,那么 m×n 即 3×2矩阵的维数即行数×列数矩阵元素(矩阵项):Aij 指第 i 行,第 j 列的元素。1.2 向量向量是一种特殊的矩阵,讲义中的向量一般都是列向量,下面展示的就是三维..

2021-11-25 17:05:38 335

原创 Python数组——Numpy(4)

学习目标目标 应用数组的通用判断函数 应用np.where实现数组的三元运算 应用 股票涨跌幅数据逻辑运算 问题如果想要操作符合某一条件的数据,应该怎么做?1 逻辑运算# 重新生成8只股票10个交易日的涨跌幅数据stock_change = np.random.normal(0, 1, (8, 10))stock_change = stock_change[0:5, 0:5]# 逻辑判断, 如果涨跌幅大于0.5就标记为True 否则为Falsestock_cha

2021-11-24 17:06:32 144 2

原创 Python数组——Numpy(3)

学习目标目标 理解数组的各种生成方法 应用数组的索引机制实现数组的切片获取 应用维度变换实现数组的形状改变 应用类型变换实现数组类型改变 应用数组的转换 应用 应用正态分布实现模拟股票的涨跌幅数据操作 1 生成数组的方法1.1 生成0和1的数组np.ones(shape[, dtype, order]) np.ones_like(a[, dtype, order, subok]) np.zeros(shape[, dtype, order]) np.zeros

2021-11-23 15:49:30 823 2

原创 Python数组——Numpy(2)

学习目标目标 说明数组ndarray的属性,形状、类型 应用 无 1 ndarray的属性数组属性反映了数组本身固有的信息。属性名字 属性解释 ndarray.shape 数组维度的元组 ndarray.ndim 数组维数 ndarray.size 数组中的元素数量 ndarray.itemsize 一个数组元素的长度(字节) ndarray.dtype 数组元素的类型 2 ndarray的形状首先创建一些数组。

2021-11-22 11:23:11 239 1

原创 Python数组——Numpy(1)

学习目标目标 了解Numpy运算速度上的优势 知道Numpy的数组内存块风格 知道Numpy的并行化运算 应用 机器学习,深度学习各种框架的基础库 1 Numpy介绍Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。

2021-11-22 10:14:33 172

原创 Jupyter notebook—— 多功能程序文档

学习目标目标 学会使用Jupyter Notebook编写运行代码 应用 创建文件 操作cell 运行操作 1 Jupyter Notebook介绍Jupyter项目是一个非盈利的开源项目,源于2014年的ipython项目,因为它逐渐发展为支持跨所有编程语言的交互式数据科学和科学计算Jupyter Notebook,原名IPython Notbook,是IPython的加强网页版,一个开源Web应用程序 名字源自Julia、Python 和 R(数据科学的三种开源语言.

2021-11-18 13:39:13 762 4

原创 Python可视化模块——Matplotlib(3)

学习目标目标 掌握常见统计图及其意义 绘制散点图和柱状图 应用 探究不同变量之间的关系 Matplotlib能够绘制折线图、散点图、柱状图、直方图、饼图。我们需要知道不同的统计图的意义,以此来决定选择哪种统计图来呈现我们的数据。1 常见图形种类及意义 折线图:以折线的上升或下降来表示统计数量的增减变化的统计图 特点:能够显示数据的变化趋势,反映事物的变化情况。(变化) api:plt.plot(x, y) 散点图:用两组数据构成多个坐标点,考察坐标

2021-11-18 12:58:58 146

原创 Python可视化模块——Matplotlib(2)

3.2 折线图(plot)与基础绘图功能学习目标目标 学习折线图的绘制和图形保存 给图形添加辅助功能(如:标注、x,y轴名称、标题等) 多次plot绘制图形 多个坐标系显示图形 知道折线图的应用场景 应用 天气的温度变化显示 1 折线图绘制与保存图片为了更好地理解所有基础绘图功能,我们通过天气温度变化的绘图来融合所有的基础API使用1.1 matplotlib.pyplot模块matplotlib.pytplot包含了一系列类似于matlab的画图函数。 它

2021-11-18 11:25:14 1345

原创 Python可视化模块——Matplotlib(1)

3.1 Matplotlib之HelloWorld学习目标目标 了解什么是matplotlib 为什么要学习matplotlib matplotlib的三层结构介绍 应用 在深度学习、股票走势、报表分析或其他方面使用Matplotlib 1 什么是MatplotlibMatplotlib是一个在Python下实现的类MatLab的第三方库,是Python下最出色的绘图库,功能很完善,同时也继承了Python简单明了的风格,它可以很方便地设计和输出二维以及三维的数据,提供了常

2021-11-18 10:22:20 420 2

原创 Python基础教学——变量及输入输出

1 关于变量1.1 初识变量在程序中,数据都是临时存储在内存中,为了更快速的查找或使用这个数据,通常我们把这个数据在内存中存储之后定义一个名称,这个名称就是变量所以说:变量即为地址名字----当你储存一个数据时,变量即为此数据所在地内存地址的名字通过给变量赋值,也将数据与一些能够描述的名字连接起来,当想要使用这些数据时,就可以通过变量直接调用1.2 定义变量在python中定义变量需要满足一定的规则: 由数字、字母、下划线组成 不能数字开头 不能使用内置关键

2021-09-07 17:06:21 1906 1

原创 Python基础教学——初识python

目录1 Python 简介—优点2 Python 下载—安装3 PyCharm 介绍—下载1.PyCharm介绍2.PyCharm下载1 Python 简介—优点Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。Python是当下最火爆的语言,其优点有: 学习成本低 可扩展 可嵌入

2021-09-06 20:46:52 346 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除