analysis
analysis
全栈开发
全栈开发工程师,互联网教育特约讲师
展开
-
analysis专栏 01.科学计算模型nmupy 01.numpy基础
# Numpy基础[toc]{type: "ol", level: [3,4,5]}### 简介- 概念> 科学计算基础库,提供大量科学计算相关的功能> 数据统计、随机数生成、多维数组类型(ndarry)- 功能> 让用户使用向量和数字矩阵### 开发环境搭建#### 查看版本- python- import numpy as numpy- numpy.\_\_version\_\_> 查看版本号...原创 2022-04-01 13:27:08 · 108 阅读 · 0 评论 -
analysis专栏 01.科学计算模型nmupy 02.ndarry矩阵
# 02.ndarray矩阵[toc]{type: "ol", level: [3,4,5]}### 生成多维数组/矩阵```pythonimport numpy as numpy# 传入数值ndarr = numpy.arange(10)```::: details result[0 1 2 3 4 5 6 7 8 9]:::paras | 说明:-------------|:---------------start | 起始值 ...原创 2022-04-01 13:29:30 · 113 阅读 · 0 评论 -
analysis专栏 01.科学计算模型nmupy 03.random随机数
# 03.random随机数[toc]{type: "ol", level: [3,4,5]}### 生成随机小数> 生成0.0-1.0之间的随机数#### 指定个数- size=n> 生成size个随机数```pythonnumpy.random.random(size=2)```::: details resultarray([0.60607276, 0.01306814]):::#### 指定行列- size=(m,n)> 生成m行n列...原创 2022-04-01 15:05:14 · 120 阅读 · 0 评论 -
analysis专栏 01.科学计算模型nmupy 04.ndarry属性
# ndarry属性[toc]{type: "ol", level: [3,4,5]}### 概述- 特性> ndarry对象是用于存放**同类型元素**{style="color:goldenrod"}的多维数组> ndarry对象中每个元素在内存中都有相同存储大小的区域- 内部组成> 一个指向数据的指针> 数据类型(dtpye),描述在数组中的固定大小值的格子> 一个表示数组形状(shape)的元组,表示各维度大小的元组### 属性att...原创 2022-04-01 15:06:32 · 139 阅读 · 0 评论 -
analysis专栏 01.科学计算模型nmupy 05.数组操作
# 05.数组操作[toc]{type: "ol", level: [3,4,5]}### 索引切片```pythonndarr = numpy.arange(12)res = ndarr[2:8:2]print(res)```::: details result[2 4 6]:::```pythonres = numpy.array( [[ 0, 1, 2, 3 , 4, 5], [ 6, 7, 8, 9, 10, 11]])`...原创 2022-04-02 09:25:26 · 60 阅读 · 0 评论 -
analysis专栏 01.科学计算模型nmupy 06.算数函数
# 06.算数函数[toc]{type: "ol", level: [3,4,5]}### 创建数组```pythonimport numpy as numpya = numpy.arange(1, 13).reshape(3,4)b = numpy.arange(2, 14).reshape(3, 4)```### 加 add()```pythona + b```::: details resultarray([[ 3, 5, 7, 9], [1...原创 2022-04-02 09:33:20 · 73 阅读 · 0 评论 -
analysis专栏 01.科学计算模型nmupy 07.聚合函数
# 07.聚合函数[toc]{type: "ol", level: [3,4,5]}#### 创建数组```pythonimport numpy as numpya = numpy.arange(1, 13).reshape(3,4)```#### 求和```pythonnumpy.sum(a)```::: details result78:::#### 求乘积```pythonnumpy.prod(a)```::: details result47900...原创 2022-04-02 09:35:53 · 426 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 01.Matplotlib概述
# 01.Matplotlib概述[toc]{type: "ol", level: [3,4,5]}### 简介 Matplotlib是一个Python的2D绘图库 可生成直方图、饼状图、功率谱、条形图、错误图、散点图等### 环境配置::: details 安装pip install Matplotlib:::::: details 导入import matplotlib.pyplot as plt:::### 绘制基础function ...原创 2022-04-02 09:53:34 · 70 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 02.绘制直线图
# 02.绘制直线图[toc]{type: "ol", level: [3,4,5]}### 一段直线```pythonimport matplotlib.pyplot as pltplt.plot([-2, 4], [4, 8])```![一段直线](imgs/01.png)### 多段直线```pythonimport matplotlib.pyplot as pltx = [1, 2, 3, 4, 5]squares = [1, 4, 9, 16, 25]...原创 2022-04-02 09:55:03 · 753 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 03.绘制曲线图
# 03.绘制曲线图[toc]{type: "ol", level: [3,4,5]}### 一元二次方程曲线```pythonimport matplotlib.pyplot as plt# 需要传入n个点 点越多越精确x = range(-100, 100)y = [i**2 for i in x]plt.plot(x, y)```![一元二次方程曲线](imgs/04.png)### 正弦|余弦曲线```pythonimport matplotlib.pyplo...原创 2022-04-02 09:56:25 · 442 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 04.绘制散点图
# 04.绘制散点图[toc]{type: "ol", level: [3,4,5]}### 散点图```pythonimport matplotlib.pyplot as pltx = range(-20, 20)y = [i**2 for i in x]plt.scatter(x, y)```![散点图](imgs/07.png)### 散点样式```pythonimport matplotlib.pyplot as pltimport numpy as npn...原创 2022-04-02 09:58:01 · 123 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 05.绘制柱状图
# 05.绘制柱状图[toc]{type: "ol", level: [3,4,5]}### 柱状图```pythonimport matplotlib.pyplot as pltx = [1980, 1985, 1990, 1995]x_label = ['1980年','1985年','1990年','1995年']y = [1000, 3000, 4000, 5000]plt.bar(x, y, width=3)plt.rcParams['font.sans-serif']...原创 2022-04-02 09:59:59 · 90 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 06.绘制饼状图
# 06.绘制饼状图[toc]{type: "ol", level: [3,4,5]}### 饼状图```pythonimport matplotlib.pyplot as plt# 比例信息man = 71351woman = 68187man_perc = man / (man + woman)woman_perc = woman / (man + woman)# 添加名称labels = ['男', '女']# 添加颜色colors = ['goldenrod',...原创 2022-04-02 10:01:23 · 134 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 07.绘制直方图
# 07.绘制直方图[toc]{type: "ol", level: [3,4,5]}### 柱状图与直方图- 柱状图> 关注**具体的某个值**{style="color:goldenrod"}- 直方图> 关注**数据分布状态**{style="color:green"}### 直方图#### 默认直方图```pythonimport matplotlib.pyplot as pltimport numpy as np# 频次直方图,均匀分布# 正态分...原创 2022-04-02 10:04:28 · 213 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 08.绘制等高线图
# 08.绘制等高线图[toc]{type: "ol", level: [3,4,5]}### 等高线```pythonimport matplotlib.pyplot as pltimport numpy as np# 可理解为:x轴有100个点,y轴有100个点x = np.linspace(-10, 10, 100)y = np.linspace(-10, 10, 100)# 计算x,y的交点a 相交出来的网格 10000个交点# 将10000个点的x轴坐标,存储于X中...原创 2022-04-02 10:05:42 · 157 阅读 · 0 评论 -
analysis专栏 02.数据可视化模块 09.绘制三维图
# 09.绘制三维图[toc]{type: "ol", level: [3,4,5]}### 三维图```pythonimport matplotlib.pyplot as pltimport numpy as npfrom mpl_toolkits.mplot3d import Axes3D# 创建X,Y,Z坐标X = np.random.rand(10000)Y = np.random.rand(10000)Z = np.random.rand(10000)fig...原创 2022-04-02 10:06:58 · 324 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 01.Series对象创建
# 01.Series对象创建[toc]{type: "ol", level: [3,4,5]}### Pandas概述 Pandas是基于Numpy的一套数据分析工具 纳入了大量标准的数据模型,提供大量工具### Series一维数组```pythonimport pandas as pddata = pd.Series([4, 3, 5, 6])print(data)```> series对象实际是将一个一维数组与一个索引名称捆绑![一维数组](i...原创 2022-04-02 10:08:54 · 229 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 02.DataFrame对象创建
# 02.DataFrame对象创建[toc]{type: "ol", level: [3,4,5]}### 通过字典创建```pythonimport pandas as pdpopulation_dict = {'beijing': 3000, 'shanghai':1200, 'guangzhou':1800}area_dict = {'beijing': 300, 'shanghai': 180, 'guangzhou':200, }# 将两个series对象作为字典的值,就...原创 2022-04-02 10:10:29 · 527 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 03.获取Series对象的值
# 03.获取Series对象的值[toc]{type: "ol", level: [3,4,5]}### Series取值#### 获取单个值```pythonimport pandas as pddata = pd.Series([4, 3, 23, 2, 3], index=list('abcde'))print('根据key获取:', data['c'])print('根据索引获取:', data[1])```::: details result根据key获取: 23...原创 2022-04-02 10:12:41 · 710 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 04.获取DataFrame对象的值
# 04.获取DataFrame对象的值[toc]{type: "ol", level: [3,4,5]}### 创建对象```pythonimport numpy as npimport pandas as pddata = pd.DataFrame(np.arange(12).reshape(3, 4), index=list('abc'), columns=list('ABCD') )data``...原创 2022-04-02 10:14:00 · 313 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 05.Pandas常用方法
# 05.Pandas常用方法[toc]{type: "ol", level: [3,4,5]}### 创建数据```pythonimport pandas as pddata = pd.DataFrame( { 'Name': ['lili', 'bing', 'rose'], 'Num': ['1001', '1002', '1003'], 'Sex': ['man', 'woman', 'man'], 'Age...原创 2022-04-02 10:15:25 · 248 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 06.缺失值处理
# 06.缺失值处理[toc]{type: "ol", level: [3,4,5]}### 概念::: tip部分数据为空的情况处理方式:> 删除> 填充:::### 查看缺失值#### 方式1:```pythonimport numpy as npimport pandas as pddf = pd.DataFrame([[1, 2, np.nan], [4, np.nan, 6], [5, 6, 7]])dfdf.info()```![处理...原创 2022-04-02 10:16:49 · 417 阅读 · 0 评论 -
analysis专栏 03.数据处理分析模块 07.拼接与合并
# 07.拼接与合并[toc]{type: "ol", level: [2,3,4,5]}### 拼接-Series对象```pythonimport pandas as pdser1 = pd.Series([1, 2, 3], index=list('ABC'))ser2 = pd.Series([4, 5, 6], index=list('DEF'))pd.concat([ser1, ser2])```![拼接与合并](imgs/48.png)### 拼接-DataFr...原创 2022-04-02 10:19:36 · 293 阅读 · 0 评论