data_analysis
文章平均质量分 52
猪猪_女孩
人生苦短,生命渺若尘埃.
我们在拥有了物质的同时,也就拥有了心灵的歌声.
而吾所建之小博,非为其他,乃为品文、赏乐及交友所用.
盖以博伊人颦笑,所作稍逊阳刚.望公等休怪.
吾素来甚少品赏俗乐,亦不愿心附当红之优伶.
虽知此违世风所行.然执着之气终未有改.
呜呼,今之靡音皆流于世,古之风雅多遗于土.
庸风淫乐视太祖之季有加,而身怀才德者不得行其道,
此久为予所睹,恨也.吾深知普雅之事难有其为,
故有仿效陶朱之意,隐匿山水之心,
只惜居无西施同伴,行乏子期相交.
终日茕茕孑立,形影相吊,惟以小博赏心悦目,趣矣。
故曰:"宠辱不惊,看庭前花开花落".
去留无意,点赞评论一下 致谢!
展开
-
Jupyter Notebook基本使用
一.Jupyter Notebook的优缺点Jupyter Notebook提供了一个环境,用户可以在里面写代码、运行代码、查看结果,并在其中可视化数据。鉴于这些优点,Jupyter Notebook成了数据科学家眼里的一款人见人爱的工具,它能帮助他们便捷地执行各种端到端任务,如数据清洗、统计建模、构建/训练机器学习模型等。对于初学者,Jupyter Notebook也独具魅力。它的一个特色是允许把代码写入独立的cell中,然后单独执行。这样做意味着用户可以在测试项目时单独测试特定代码块,无需从头开原创 2021-02-09 11:44:26 · 2695 阅读 · 2 评论 -
数据清洗---excel异常值处理(scipy)
一.导入模块import pandas as pdfrom scipy.interpolate import interp1d二.读取excel文件data=pd.read_excel(r'E:\pythonwork\数据分析\11.数据清洗\人事终表 (1).xlsx').tail(10)print(data)''' Unnamed: 0 部门 姓名 应发数 发放时间 绩效 合计工资108 108 讲解员(6人) 张原创 2021-01-06 21:03:57 · 4206 阅读 · 1 评论 -
聚合函数处理excel数据------(一)
import numpy as npimport pandas as pd一.transform 聚合函数在pandas 或者numpy 中没有现成的函数可以使用,可以通过transformdata=pd.read_excel(r’地址’)写法一:data2=data[‘counts’].transform(lambda x:x*2)写法二:def transforml(value):values=value*2return valuesdata2=data[‘counts’].tra原创 2021-01-04 23:13:09 · 1981 阅读 · 13 评论 -
matplotlib绘图-----全
一.导入模块import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.gridspec import GridSpec二.画布参数# 1.修改字体plt.rcParams['font.sans-serif']='SimHei'# 2.修改符号显示plt.rcParams['axes.unicode_minus']=False# 3.修正背景颜色plt.rcParams['axes.facecolor']='#0D0原创 2021-01-01 22:24:31 · 269 阅读 · 2 评论 -
pandas数据处理-----(一)
pandas1.表格数据操作:[增删改查]2.实现多个表格的处理3.数据清洗操作: 缺失值,重复值,异常值,数据标准化,数据转化的操作4.实现excel的特殊操作,生成透视表,交叉分析5.完成统计分析一.构建dataframe# 创建方法一import pandas as pddf=pd.DataFrame(data=[['ss',20,'男','0831'],['lx',18,'女','0831'],['lx',18,'女','0831']], index=原创 2020-12-31 00:11:44 · 638 阅读 · 0 评论 -
matplotlib 散点图的绘制-----(二)
导入模块import matplotlib.pyplot as pltimport numpy as np一.绘制多条散点图1.创建画布plt.figure(figsize=(8,6),facecolor=‘black’)2.添加坐标点x=np.arange(0,2*np.pi,0.1)y1=np.sin(x)y2=np.cos(x)3.绘制第一条线和第二条线plt.scatter(x,y1,c=‘pink’,s=50)plt.scatter(x,y2,c=y2,cmap=‘rain原创 2020-12-27 23:02:13 · 357 阅读 · 9 评论 -
matplotlib 散点图的绘制-----(一)
matplotlib 绘图导入模块import matplotlib.pyplot as pltimport numpy as np一.画布参数1.修改字体plt.rcParams['font.sans-serif']='SimHei'2.修改符号显示plt.rcParams['axes.unicode_minus']=False3.修正背景颜色plt.rcParams['axes.facecolor']='#0D0434'# plt.rcParams['axes.facecol原创 2020-12-27 20:32:40 · 369 阅读 · 0 评论 -
数组的函数及运算-----(二)
一.文件操作a.二进制文件操作 b.文本文件.npy/.npz文件:二进制文件,必须通过numpy来操作# 二进制文件的生成与读取arr3=np.random.random(20).reshape((10,2))np.save("arr.npy",arr3) #后缀名可以省略# 读取二进制文件np.load("arr.npy") # 完整的名字+后缀名'''array([[ 0.71585413, 0.7233967 ], [ 0.42144233, 0.原创 2020-12-25 20:40:45 · 177 阅读 · 0 评论 -
数组的函数及运算------(一)
一.特殊函数创建数组1.等差数列import numpy as nparr1=np.linspace(2,10,5)print(arr1) #[ 2. 4. 6. 8. 10.]"""np.linspace(start=a1, stop=an, num=50, endpoint=True, retstep=False, dtype=None, axis=0)参数说明: endpoint=True: 表示等差数列, 在start与stop之间插入 n-2 个值;(n原创 2020-12-23 23:56:46 · 463 阅读 · 0 评论 -
矩阵/数组的创建-----(二)数据分析
1.numpy矩阵numpy: 计算模块主要有两种数据类型 ----数组 矩阵特点: 运算快# 1.numpy创建矩阵import numpy as npmat1=np.mat("1 2 3;2 3 4;1 2 3")mat2=np.mat("1 2 3 ;3 4 5 ;4 5 6")mat3=np.mat("1 2 ; 3 4 ;2 4")mat4=np.mat("1 3 ;4 3")mat5=np.mat("1;2;3")mat6=np.mat("1 2 3")print(m原创 2020-12-23 22:57:27 · 157 阅读 · 2 评论 -
矩阵的运算----(一)
矩阵高阶行列式(>=3阶行列式)------它是一个方阵性质:1.行列式与它转置行列式相等2.对换行列式的两行或者两列,行列式变号3.行列式中如果存在两行或者两列完全相同或者成比例,则此行列式为04.行列式某一行或者某一列同乘一个数k,等于此行列式乘以k5.若行列式的某一行的元素是两个数的和,可以分开为两个行列式6.把行列式的某一行/列的各元素乘以同一个数然后加到另一行/列的对应元素上,行列式不变余子式 Mij代数余子式 Aij=(-1)^(i+j) * Mij...原创 2020-12-22 17:00:36 · 1138 阅读 · 0 评论