数据分析
柏林墙
这个作者很懒,什么都没留下…
展开
-
np.reshape中-1详解
先生成一个倒序的数组a = np.arange(12,0,-1)array([12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1])当对数组reshape时代表改变数组的形状为一维、二维、三维、n维1. 二维:一个为确定的数,另一个为-1a.reshape(2, -1)array([[12, 11, 10, 9, 8, 7], [ 6, 5, 4, 3, 2, 1]])a.reshape(-1, 3)array([[12, 11,原创 2021-01-28 17:14:17 · 1640 阅读 · 0 评论 -
pandas速查手册
在本备忘单中,我们将使用以下速记:df| 任何pandas DataFrame对象s| 任何pandas系列对象向下滚动时,您会看到我们已经使用副标题组织了相关命令,因此您可以根据要尝试完成的任务快速搜索并找到正确的语法。另外,快速提醒一下-要使用下面列出的命令,您需要先导入相关的库,如下所示:import pandas as pdimport numpy as np汇入资料使用这些命令可以从各种不同的来源和格式导入数据。pd.read_csv(filename)| 从CSV文件pd.r转载 2020-10-06 17:29:21 · 226 阅读 · 0 评论 -
pandas的数据清洗和准备
1. 处理缺失数值string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado']) # np.nan为空数值string_datastring_data[0] = None # None也可以判为空string_data.isnull() # 对空数值判断1.1 过滤缺失值对于Series来说,直接通过series.dropna()对于DataFrame,frame.dropna()会删除含有NaN的行,ax原创 2020-10-03 17:26:59 · 234 阅读 · 1 评论 -
pandas基本使用(一)-- 利用python进行数据分析笔记(第五章)
import pandas as pdfrom pandas import Series, DataFrameSeries1. 创建Series直接将列表创建为Series类型obj = pd.Series([4, 7, -5, 3]),此时索引为默认0~n将索引替换为自定义值 obj2 = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])对字典直接转化Series: sdata = {'Ohio': 35000, 'Texas': 7原创 2020-10-02 20:13:38 · 240 阅读 · 0 评论 -
Matplotlib教程四:提高可视化-颜色-线条-样式表-轴线-图案填充
0. 代码声明import matplotlib.pyplot as pltimport matplotlib as mplimport numpy as npimport pandas as pdmpl.rcParams['font.sans-serif'] = ['SimHei']mpl.rcParams['axes.unicode_minus'] = False......plt.show()1. 不同颜色和线条样式fig = plt.figure(figsize=(12,6原创 2020-08-21 10:48:11 · 878 阅读 · 0 评论 -
Matplotlib教程三:subplot子画布详解
效果展示:subplot(222)子画布 一个图形中多个轴域通过subplot(2,2), axs[0,0]子画布的表示同时显示出两个图形,每个图形都有多个子图,通过subplot2grid定义子图位置代码示例import matplotlib.pyplot as pltimport matplotlib as mplimport numpy as npimport pandas as pdmpl.rcParams['font.sans-serif'] = ['SimHe原创 2020-08-20 10:17:28 · 1449 阅读 · 1 评论 -
Matplotlib教程二:各种图例
常用头import matplotlib.pyplot as pltimport numpy as npimport matplotlib as mplmpl.rcParams[ 'font.sans-serif' ] = ['SimHei'] # 设置字体mpl.rcParams['axes.unicode_minus'] = False柱状图x = np.arange(9)[1:]y = np.random.randint(1,10,8)# 柱状图# plt.bar(x,y原创 2020-08-15 21:54:42 · 1338 阅读 · 1 评论 -
Matplotlib教程一:画图形基本元素
1. 基本术语figure 图元素axes 轴域:为figure图的一部分轴 分x、y、z 轴title 标题:可以使axes或figure的名字刻度标签:主刻度:(0-1,1-2,2-3,3-4),次刻度:(0-0.25,0.25-0.5,0.5-0.75,0.75-1.0)legend 图例:右上角的图像示例交互模式:通过shell或Jupyter一句一句实现查看,开启plt.ion(),通过plt.is_interactive()判断是否为交互模式在非原创 2020-08-14 21:36:22 · 360 阅读 · 0 评论 -
numpy对txt、csv、xlsx、npy、npz文件操作
numpy对txt、csv、xlsx、npy、npz文件操作arr = np.arange(10)np.save('some_array', arr) # 保存数组到文件中np.load('some_array.npy') # 加载数组文件np.savez('array_archive.npz', a=arr, b=arr) # 保存多个数组到文件中np.savez_compressed('arrays_compressed.npz', a=arr, b=arr) # 保存并压缩原创 2020-08-14 08:27:26 · 5484 阅读 · 0 评论 -
Numpy一篇搞定基础知识
通过ipython交互,python版本3.7.6,Numpy版本1.18.11. 引入引入:import numpy as np2. 创建生成数组随机生成正态值以2*3形式显示:np.random.randn(2,3)以列表、元祖转换np.array([0, 1, 2, 3, 4]), np.array((0, 1, 2, 3, 4))numpy直接创建arange,ones,zeros,empty从磁盘文件读取3. 数组属性:a = np.array([[11, 12, 1.原创 2020-08-12 23:08:30 · 523 阅读 · 0 评论