- 博客(58)
- 资源 (1)
- 收藏
- 关注
原创 标题行列标签表格与图形的应用以及图例和保存图片
查看吸烟和不吸烟者消费账单的平均值plt.subplot(facecolor=np.random.random(size=3))tips.groupby('smoker')["total_bill"].mean().plot(kind="bar")plt.grid()plt.ytick([0,10,20],["min","middle","max"],fontsize=15,color=n...
2020-01-16 20:59:07 421
原创 子画布/坐标轴界限/坐标轴标签/画布标题
子画布使用plt.grid方法可以开始网格线,使用plt面向对象的方法,创建多个子图显示不同网格线lw代表linewidth 线的粗细alpha 表示线的透明度color 表示颜色axis 显示轴向plt.grid(axis='y')axes = plt.subplot(111)axes.grid(axis='both')plt.figure(figsize=(10,...
2020-01-16 20:39:19 586
原创 Matplotlib基础知识
一、Matplotlib基础知识Matplotlib中的基本图表包括的元素x轴与y轴axis 水平和垂直的轴线轴标签 axisLable 水平和垂直的轴标签x轴和y轴刻度 tick刻度标示坐标轴的分隔,包括最小刻度和最大刻度x轴和y轴刻度标签tick label 表示特定坐标轴的值绘图区域 axes 实际绘图的区域画布 figure 呈现所有的坐标系1. 绘制有正弦曲x = ...
2020-01-16 20:18:42 275
原创 Scipy文件输入/输出
Scipy文件输入/输出import scipy.io as io 随机生成数组,使用scipy中的io.savemat()保存文件格式是.mat,标准的二进制文件io.savemat('data', mdict={ "data":data})image = io.loadmat('data.mat')读写图片使用scipy中misc.imread()/imsave()mi...
2020-01-16 19:49:10 246
原创 处理文件夹中全部图片
def gray_for_images(path): all_image_type = ["jfif","bmp","jpg","png","tif","gif","pcx","tga","exif","fpx","svg","psd","cdr","pcd","dxf","ufo","eps","ai","raw","WMF","webp"] for path,dir_name,...
2020-01-16 19:44:15 257
原创 数值积分,求解圆周率
数值积分,求解圆周率f = lambda x:(1-x**2)**0.5a = -1b = 1from scipy.integrate import quadarea, err = quad(f, a, b)area*2
2020-01-16 19:43:12 949
原创 图片消噪与灰度处理
图片消噪scipy.fftpack模块用来计算快速傅里叶变换速度比传统傅里叶变换更快,是对之前算法的改进图片是二维数据,注意使用fftpack的二维转变方法moon = plt.imread('moonlanding.png')plt.figure(figsize=(12,8))plt.imshow(moon, cmap=plt.cm.gray) # 'gray'加载图片# ...
2020-01-16 19:39:00 395
原创 散布图(散点图)
散布图(散点图)通常是连续值与连续值之间的对应关系也可能是连续值和离散值之间的对应关系离散值之间一般不需要表达散点图的关系# 查看消费随着账单变化的对应关系# x表示作为横轴展示列标签名字# y表示作为纵轴展示列标签的名字# 连续值与连续值的对应关系# 作为散点图的列,必须是数值类型# 可以使用map函数对不是数值的列进行数值映射tips.plot(kind="scatter"...
2020-01-16 19:29:03 4108
原创 直方图
直方图data = Series(data=np.random.randn(1000))data.plot(kind='hist')直方图:统计的是每个数据区间,数据出现的次数normed:把次数转换成可能出现的概率核密度估计,把每个数据区间可能出现的概率进行统计data.plot(kind='hist', bins=5, normed=True)data.plot(kind='...
2020-01-16 19:15:36 287
原创 pandas中的绘图函数(柱状图)
pandas中的绘图函数(柱状图)Series柱形图示例kind = ‘bar’/‘barh’s = Series(data=np.random.randint(60,98, size=5),index=list("ABCDE"))s.plot(kind='bar')DataFrame柱状图示例df = DataFrame(data=np.random.randint(0,100,...
2020-01-16 19:02:58 2634 1
原创 pandas中的绘图函数(线型图)
pandas中的绘图函数线型图now = pd.datetime.now()#periods 时间节点的个数index = pd.data_range(start=now,periods=20,freq="M")s = Series(data=np.random.randint(100,120,size=20), name="weight", index=index)# kind='l...
2020-01-16 18:01:34 1899
原创 数据分类/组处理
数据分类/组处理groupby() 分组函数分组之后必聚合,只对数字的列聚合单列进行分组data.groupby(“attack_range”).mean()[“hp_max”]使用列表进行多条件分组data.groupby([“attack_range”,“role_main”]).mean()[“hp_max”]对不同列求不同的聚合指标gp = data.groupby([“a...
2020-01-09 19:43:03 907
原创 排序
排序numpy sort partitionseries sort_values sort_indexDataFrame sort_values(by)np.random.permutation(10) 随机索引随机排序使用take()函数排序take()函数接受一个索引列表,用数字表示eg:df.take(【1,2,3,5】)随机排序 take + permutation...
2020-01-09 19:26:32 151
原创 数据异常值检测和过滤
数据异常值检测和过滤查看数据信息infoheaddescribe使用describe()函数查看每一列的描述性统计量空值处理:isnull()判空 fillna()填充 dropna()删除重复值处理:duplicated()查看重复行 drop_duplicates() 删除重复行异常值处理:(整列数据像转换成标准的正态分布) 数值 > 3*std离群点结合业务...
2020-01-09 19:03:13 1745
原创 rename()函数
rename()函数可以直接通过columns 去传入对应列的名字,去改变列名这种效率比rename的效率要高的多score.columns = ["python","java","ps", "js"]rename()函数的参数:mapper=None,axis=Nonemapper中以字典形式去更改列字段名称axis 指定替换行还是列index=None, 替换行索引col...
2020-01-09 17:57:23 2319
原创 map()函数
map()函数使用:map()可以使用字典映射新一列数据map()可以使用lambd表达式map()中可以使用方法,可以是自定义方法注意:map()中不能使用sum函数之类的,for循环map(字典)字典的键要足以匹配所有的数据,否则会出现NaNtransform()函数transform() 与 map()函数类似读取表单数据以键值对读取练习: 新增两列,分别为...
2020-01-09 17:50:40 1040
原创 映射
映射映射的含义:创建一个映射关系的列表,把values元素和一个特定的标签或者字符串绑定映射操作:replace()函数:替换元素(DataFrame\Series的函数)最重要:map()函数:新建一列(Series的函数)rename()函数:替换索引(DataFrame函数)例子:df = DataFrame({ "name":["lucy","lmery","lucy...
2020-01-09 17:36:39 485
原创 pandas数据处理
pandas数据处理1、删除重复元素合并只处理列不处理行重复元素只检测行,不检测列使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每一个元素对应一行,如果该行不是第一次出现,则元素为Truedfduplicated()函数的参数:subset=None, keep=‘first’subset 指定列标签列表,列表内的标签是用于检测重复数据的字...
2020-01-09 17:17:04 325
原创 pandas的汇总操作
pandas的汇总操作pandas的拼接分为两种:级联:pd.concat,pd.append合并:pd.merge,pd.join级联的业务应用场景:业务表结构相同或相似numpy的级联numpy级联必须保证在级联的方向上,数据个数一致如果数据个数不一致,无法级联pd.concat((df1,df2))默认是纵向方向级联,两张表的标签顺序可以不一致以标签为基准axi...
2020-01-08 21:04:51 807
原创 聚合操作
聚合操作pandas的聚合默认是列方向的聚合pandas的聚合默认忽略空值注意:需要制定axis和unstack()相反,聚合的时候。axis等于哪一个,哪一个就保留axis=0 列axis =1 行所谓的聚合操作:平均数,方差,最大值,最小值……...
2020-01-08 19:24:45 533
原创 索引的堆(stack)
堆(stack)方法:stack()使用stack()的时候,level等于哪一个,哪一个就消失,出现在行里。unstack()使用unstack()的时候,level等于哪一个,哪一个就消失,出现在列里。df.stack(level=-2).unstack(level=-2)...
2020-01-08 18:52:28 202 1
原创 pandas层次化索引
pandas层次化索引1.创建多层行索引(1)隐式构造最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组Series也可以创建多层索引(2)显式构造pd.Multiindex使用数组arrays = [["第一季度","第一季度","第一季度","第二季度","第二季度","第二季度"], ["收入","成本","...
2020-01-08 18:48:11 474
原创 pandas空值处理
处理丢失数据有两种丢失数据:Nonenp.nan(NaN)np.nan 数据类型 float 类型1.NoneNone 是python自带的,器类型为python object。因此,None不能参与到任何计算中。object 类型的运算要比int类型运算慢的多计算不同数据类型仇和事件%timeit np.arange(1e5,dtype=xxx).sum()2.np.n...
2020-01-08 17:29:37 529
原创 DataFrame的创建
DataFrame创建from pandas import DataFrame# data=None numpy.array 2维度表格# index=None 行索引, 所有的Series对象公用一个行索引# columns=None 列索引, 每一个Series的name属性dic = { "name":["lucy","tom","jack","mery"], ...
2020-01-07 17:42:31 382
原创 DataFrame的运算
DataFrame的运算种类:DataFrme 看成事Series的字典对象 , 列标签就是字典的键, 每一列数据就是字典的值1.DataFrame 和 numpy 广播机制具有广播机制添加的时候索引对不上可以使用函数add()df1.add(df, fill_value=0) 给空值补02.DataFrame 和 DataFrame同Series一样:在运算中自动对齐相同索...
2020-01-07 17:38:39 1089
原创 练习
切片注意:直接使用中括号时:索引表示的是列索引切片表示的是行切片创建一个成绩表,学生(行索引):lucy, tom, jack, mery, toney学科(列索引):java, python, php查找java成绩大于50分的所有学员名字查找python成绩大于平均值的所有信息查找jack的java成绩,加上5分获取只包含name和python列的子表#创建成绩表模型...
2020-01-07 17:28:56 232
原创 访问总结
访问总结:显式访问: 列访问: 1.列访问可以直接使用中括号访问,也可以使用【列标签列表】访问 2.但是使用BOOL列表默认访问的是行 3.多列访问:df.loc[:,BOOL列表] 4.属性访问:df.col_name 行访问: 1.df.loc[row_name] df.loc[[row_name1,row_name2]] 2.使用BOOL列表访问 df.loc[...
2020-01-07 17:15:58 169
原创 numpy 库中的一些语法
一、创建Array1.使用np.array() 由 python list 创建numpy设计初衷是用与运算的,所以对数据类型进行统一优化数组:一组【有序】的【类型相同】的数据集合列表:一组有序的数据的集合导入numpy库并且改名为npimport numpy as np注意:numpy默认所有的元素类型是相同的如果传进来的列表包含不同的类型,则统一为同一类型,优先级: st...
2020-01-06 21:33:38 467
原创 jupyter notebook 基本操作
一.jupyter notebook两种模式code 编码模式MarkDown 文本模式Ctrl + Enter 运行当前单元格call 有两种状态选中状态(对单元格做管理(新增,删除,复制,模式切换))编辑状态(对单元格内容做编辑)模式切换esc切换为选状态选中状态下嗯Y切换code 比那吗模式选中状态下嗯M 切换MarkDown 文本模式单元个快捷键:...
2020-01-06 18:50:56 586
原创 Flask查询以及分页
Flask查询以及分页以动物类做例子下面创建动物的表class Animal(db.Model): id = db.Column(db.INTEGER, primary_key=True, autoincrement=True) a_name = db.Column(db.String(32)) a_age = db.Column(db.Integer, defaul...
2019-12-19 17:36:39 1882
原创 Django用户认证user对象
Django用户认证user对象一、内置auth_user表(1) 表结构mysql> desc auth_user;+--------------+--------------+------+-----+---------+----------------+| Field | Type | Null | Key | Default | Extra ...
2019-12-09 23:41:30 383
原创 分页
分页目的?提升响应速度提升用户体验可以帮助用户节约资源实现分页page第几页(页码)per_page 页面数据量(每一页显示多少条)要求每一页十条显示第五页的数据跳过前(5-1)*10 offset限制结果集10 limitSQLite轻量级数据库微小的功能比较简单无用户名密码不允许远程连接什么场景用AndroidIOSWP...
2019-12-07 17:32:39 85
原创 会话技术
会话技术干啥的:辅助服务器识别用户怎么实现:主要有三大技术:内置实现CookieSeesion自定义Token什么时候使用:只要需要识别用户想要用户历史信息服务器为什么不能识别客户端服务器面向很多客户端识别难度高,性能低请求生生命周期从request开始到response结束目前使用的http都是短连接Http协...
2019-12-07 17:32:34 83
原创 Model 模型
Model 模型一、配置数据库settings.py文件中 默认为sqlite数据库 更改成mysql数据库实例:DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'helloworld', 'HOST':'127.0.0.1', ...
2019-12-07 17:32:17 2080 1
原创 Day04
MVT优点 一个程序员快速实现站点开发缺点 想实现前端很漂亮 或存在特效 很难实现解决方案 前后端分离 后端 数据 业务逻辑 数据展示? 给数据 前端: 界面展示 从后端请求数据分离 后端工作量降低了 后端不用再写模板了 数据包装格式 Json 前端: 标准工作开发模式: POP AOP OOP IO...
2019-12-07 17:32:11 107
原创 Django邮件发送,登陆注册
Django邮件发送 注册登录一、邮件发送设置临时环境变量windows下设置set 名称=值获取set 名称Linux下设置export 名称=值获取echo $名称实例:export xlg=luckyecho $xlg配置settings.py# 配置发送邮件所需的配置EMAIL_HOST = 'smtp.1000phone.com' # smtp服务器...
2019-12-07 17:27:59 745
原创 Admin站点管理
Admin站点管理一、配置admin应用settings.pyINSTALLED_APPS = [ 'django.contrib.admin',]二、创建管理员用户命令:python3 manage.py createsuperuser一次输入 用户名 邮箱 密码三、汉化 (配置中国时区)settings.pyLANGUAGE_CODE = 'zh-Hans'...
2019-12-07 16:33:11 401
原创 缓存与站点配置
Django-cache缓存概述:对于中等流量的网站来说,尽可能减少开销是必要的,缓存数据就是为了保存哪些需要很多计算资源的结果,这样就不必在下次请求消耗计算机资源 Django自带一个非常健壮的缓存功能(1)缓存配置settings.py配置缓存在数据库中CACHES={ 'default':{ #缓存位置 'BACKEND':'django.core.cache.backen...
2019-12-07 14:38:16 308
原创 上传图片
settings:默认文件存在内存中MEDIA_ROOT = os.path.join(BASE_DIR,'static/image')htmlmultipart/form-data不对字符编码。当使用有文件上传控件的表单时,该值是必需的。<!DOCTYPE html><html lang="en"><head> <meta c...
2019-12-04 10:17:00 131
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人