juyter notebook
my_白白白
这个作者很懒,什么都没留下…
展开
-
标题行列标签表格与图形的应用以及图例和保存图片
查看吸烟和不吸烟者消费账单的平均值plt.subplot(facecolor=np.random.random(size=3))tips.groupby('smoker')["total_bill"].mean().plot(kind="bar")plt.grid()plt.ytick([0,10,20],["min","middle","max"],fontsize=15,color=n...原创 2020-01-16 20:59:07 · 384 阅读 · 0 评论 -
子画布/坐标轴界限/坐标轴标签/画布标题
子画布使用plt.grid方法可以开始网格线,使用plt面向对象的方法,创建多个子图显示不同网格线lw代表linewidth 线的粗细alpha 表示线的透明度color 表示颜色axis 显示轴向plt.grid(axis='y')axes = plt.subplot(111)axes.grid(axis='both')plt.figure(figsize=(10,...原创 2020-01-16 20:39:19 · 563 阅读 · 0 评论 -
Matplotlib基础知识
一、Matplotlib基础知识Matplotlib中的基本图表包括的元素x轴与y轴axis 水平和垂直的轴线轴标签 axisLable 水平和垂直的轴标签x轴和y轴刻度 tick刻度标示坐标轴的分隔,包括最小刻度和最大刻度x轴和y轴刻度标签tick label 表示特定坐标轴的值绘图区域 axes 实际绘图的区域画布 figure 呈现所有的坐标系1. 绘制有正弦曲x = ...原创 2020-01-16 20:18:42 · 251 阅读 · 0 评论 -
Scipy文件输入/输出
Scipy文件输入/输出import scipy.io as io 随机生成数组,使用scipy中的io.savemat()保存文件格式是.mat,标准的二进制文件io.savemat('data', mdict={ "data":data})image = io.loadmat('data.mat')读写图片使用scipy中misc.imread()/imsave()mi...原创 2020-01-16 19:49:10 · 206 阅读 · 0 评论 -
处理文件夹中全部图片
def gray_for_images(path): all_image_type = ["jfif","bmp","jpg","png","tif","gif","pcx","tga","exif","fpx","svg","psd","cdr","pcd","dxf","ufo","eps","ai","raw","WMF","webp"] for path,dir_name,...原创 2020-01-16 19:44:15 · 224 阅读 · 0 评论 -
数值积分,求解圆周率
数值积分,求解圆周率f = lambda x:(1-x**2)**0.5a = -1b = 1from scipy.integrate import quadarea, err = quad(f, a, b)area*2原创 2020-01-16 19:43:12 · 895 阅读 · 0 评论 -
图片消噪与灰度处理
图片消噪scipy.fftpack模块用来计算快速傅里叶变换速度比传统傅里叶变换更快,是对之前算法的改进图片是二维数据,注意使用fftpack的二维转变方法moon = plt.imread('moonlanding.png')plt.figure(figsize=(12,8))plt.imshow(moon, cmap=plt.cm.gray) # 'gray'加载图片# ...原创 2020-01-16 19:39:00 · 370 阅读 · 0 评论 -
散布图(散点图)
散布图(散点图)通常是连续值与连续值之间的对应关系也可能是连续值和离散值之间的对应关系离散值之间一般不需要表达散点图的关系# 查看消费随着账单变化的对应关系# x表示作为横轴展示列标签名字# y表示作为纵轴展示列标签的名字# 连续值与连续值的对应关系# 作为散点图的列,必须是数值类型# 可以使用map函数对不是数值的列进行数值映射tips.plot(kind="scatter"...原创 2020-01-16 19:29:03 · 3947 阅读 · 0 评论 -
直方图
直方图data = Series(data=np.random.randn(1000))data.plot(kind='hist')直方图:统计的是每个数据区间,数据出现的次数normed:把次数转换成可能出现的概率核密度估计,把每个数据区间可能出现的概率进行统计data.plot(kind='hist', bins=5, normed=True)data.plot(kind='...原创 2020-01-16 19:15:36 · 259 阅读 · 0 评论 -
pandas中的绘图函数(柱状图)
pandas中的绘图函数(柱状图)Series柱形图示例kind = ‘bar’/‘barh’s = Series(data=np.random.randint(60,98, size=5),index=list("ABCDE"))s.plot(kind='bar')DataFrame柱状图示例df = DataFrame(data=np.random.randint(0,100,...原创 2020-01-16 19:02:58 · 2589 阅读 · 1 评论 -
pandas中的绘图函数(线型图)
pandas中的绘图函数线型图now = pd.datetime.now()#periods 时间节点的个数index = pd.data_range(start=now,periods=20,freq="M")s = Series(data=np.random.randint(100,120,size=20), name="weight", index=index)# kind='l...原创 2020-01-16 18:01:34 · 1856 阅读 · 0 评论 -
数据分类/组处理
数据分类/组处理groupby() 分组函数分组之后必聚合,只对数字的列聚合单列进行分组data.groupby(“attack_range”).mean()[“hp_max”]使用列表进行多条件分组data.groupby([“attack_range”,“role_main”]).mean()[“hp_max”]对不同列求不同的聚合指标gp = data.groupby([“a...原创 2020-01-09 19:43:03 · 867 阅读 · 0 评论 -
排序
排序numpy sort partitionseries sort_values sort_indexDataFrame sort_values(by)np.random.permutation(10) 随机索引随机排序使用take()函数排序take()函数接受一个索引列表,用数字表示eg:df.take(【1,2,3,5】)随机排序 take + permutation...原创 2020-01-09 19:26:32 · 117 阅读 · 0 评论 -
数据异常值检测和过滤
数据异常值检测和过滤查看数据信息infoheaddescribe使用describe()函数查看每一列的描述性统计量空值处理:isnull()判空 fillna()填充 dropna()删除重复值处理:duplicated()查看重复行 drop_duplicates() 删除重复行异常值处理:(整列数据像转换成标准的正态分布) 数值 > 3*std离群点结合业务...原创 2020-01-09 19:03:13 · 1690 阅读 · 0 评论 -
rename()函数
rename()函数可以直接通过columns 去传入对应列的名字,去改变列名这种效率比rename的效率要高的多score.columns = ["python","java","ps", "js"]rename()函数的参数:mapper=None,axis=Nonemapper中以字典形式去更改列字段名称axis 指定替换行还是列index=None, 替换行索引col...原创 2020-01-09 17:57:23 · 2268 阅读 · 0 评论 -
map()函数
map()函数使用:map()可以使用字典映射新一列数据map()可以使用lambd表达式map()中可以使用方法,可以是自定义方法注意:map()中不能使用sum函数之类的,for循环map(字典)字典的键要足以匹配所有的数据,否则会出现NaNtransform()函数transform() 与 map()函数类似读取表单数据以键值对读取练习: 新增两列,分别为...原创 2020-01-09 17:50:40 · 1003 阅读 · 0 评论 -
映射
映射映射的含义:创建一个映射关系的列表,把values元素和一个特定的标签或者字符串绑定映射操作:replace()函数:替换元素(DataFrame\Series的函数)最重要:map()函数:新建一列(Series的函数)rename()函数:替换索引(DataFrame函数)例子:df = DataFrame({ "name":["lucy","lmery","lucy...原创 2020-01-09 17:36:39 · 426 阅读 · 0 评论 -
pandas数据处理
pandas数据处理1、删除重复元素合并只处理列不处理行重复元素只检测行,不检测列使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每一个元素对应一行,如果该行不是第一次出现,则元素为Truedfduplicated()函数的参数:subset=None, keep=‘first’subset 指定列标签列表,列表内的标签是用于检测重复数据的字...原创 2020-01-09 17:17:04 · 283 阅读 · 0 评论 -
索引的堆(stack)
堆(stack)方法:stack()使用stack()的时候,level等于哪一个,哪一个就消失,出现在行里。unstack()使用unstack()的时候,level等于哪一个,哪一个就消失,出现在列里。df.stack(level=-2).unstack(level=-2)...原创 2020-01-08 18:52:28 · 161 阅读 · 1 评论