自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 真香系列_Spring框架(AOP切面)

目录一、spring的AOP(切面)1. jdk的动态代理2. cglib代理3. springAop的方式一、spring的AOP(切面)项目当中,我们可能因为一些需求,去修改其中的一个方法,因此需要切面编程。切面有两种代理方式:1.jdk动态代理(只能修改接口中的方法)2.cglib代理(只能修改类中的方法)1. jdk的动态代理首先写个类,随便写两个方法写一个接口类去实现:写一个JDK代理类:进行测试:测试结果:2. cglib代理首先写个类,随便写两个方法写一

2020-06-27 23:14:37 244

原创 数据大清洗_Pyecharts 可视化(安装Pyecharts )(Pyecharts 图表绘制)

目录一、Pyecharts 认识(一)对 Pyecharts 认识(二)安装:二、Pyecharts 图表绘制(一)Pyecharts 绘制图表理解1、全局配置项2、系列配置项3、注意:数据格式(二)图表绘制1、柱状图2、饼图3、玫瑰图一、Pyecharts 认识(一)对 Pyecharts 认识Pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化。Pyecharts 是一个用于生成 Echarts 图表的类库。实际

2020-06-23 23:27:21 1267

原创 数据大清洗_Pandas库进阶(标准化数据)(转换数据)

目录一、标准化数据(一)离差标准化数据(二)标准差标准化数据(三)小数定标标准化数据(四)三种标准化的特点:二、转换数据(一)哑变量处理类别数据(二)离散化三、案例(坏账率分析案例)一、标准化数据(一)离差标准化数据离差表转化是对原始数据的一种线性变换,结果是将原始的数据映射到[0,1]区间之间, 转换公式为:import pandas as pdimport numpy as np# 剔除数据量级的影响,减小运算量 ---数据标准化""" 标准化 1、离差标准化

2020-06-22 22:16:24 1132

原创 数据大清洗_Pandas库进阶(综合案例-医院数据统计)

目录一、项目介绍二、代码一、项目介绍近些年来,随着人民生活的提升,人民群众对于医疗条件的选择尤为重视,为此,各个诊所、医院应运而生来保障人民的身体健康。以下为某医院售药部分的售药记录情况,请根据该医院的售药记录数据,进行相关数据处理,并提出问题,挖掘其中有价值的信息,为该医院的下一步营销进行指导。先进行数据清洗:(1)把列索引变为容易理解的索引值(2)删掉有空值的数据(3)将’销售数量’,‘应收金额’,'实收金额’数据类型转换为 int(4)删除’销售数量’,‘应收金额’,'实收金额’中

2020-06-20 23:01:25 611 1

原创 数据大清洗_Pandas库进阶(数据重复值处理)(数据缺失值处理)

目录一、处理重复值1、记录重复2、特征重复一、处理重复值1、记录重复即一个或者多个特征某几个记录的值完全相同。方法:方法一: 利用列表(list)去重,自定义去重函数。方法二:是利用集合(set)的元素是唯一的特性去重,如 dish_set=set(dishes)。 比较上述两种方法可以发现,方法一代码冗长。方法二代码简单了许多,但会导致数据的排列发生改变。方法三:(推荐) pandas提供了一个名为drop_duplicates的去重方法。该方法只对DataFrame或者 Series 类

2020-06-20 21:15:34 2223

原创 数据大清洗_Pandas库进阶(数据合并)

目录一、认识数据处理二、数据集成-concat(一)横向堆叠-concat(二)纵向堆叠-concat三、垂钓装备的合并案例四、主键合并-megre一、认识数据处理1、现实世界的数据是“肮脏的”——数据多了,什么问题都会出现(1)不完整的:缺少属性值,缺少感兴趣的属性,或仅包含聚集数据。 如:e.g., Occupation=“”; (2)含噪声的:包含错误或者“孤立点”。 e.g.,Salary=“-10”; (3)不一致的:在编码或者命名上存在差异。E.g.Age=“42” Birthday=

2020-06-18 22:28:26 780

原创 数据大清洗_Pandas库进阶(TGI指数分析案例)(统计分析案例)

目录一、TGI指数分析案例二、连锁超市统计分析案例一、TGI指数分析案例什么是 TGI?TGI:即 Target Group Index(目标群体指数),可反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者)内的强势或弱势。公式:TGI 指数= [目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例]*标准数 100。例如将某地区 15-24 岁的人作为目标群体,将去[电影网站 A]看电影作为相同特征;若该地区 15-24 岁的人中,有 8.9%

2020-06-18 20:57:23 993

原创 数据大清洗_Pandas库进阶(Pandas聚合查询)(Pandas透视表与交叉表)

没有废话,没有套话,人生苦短,只看干货

2020-06-16 22:54:09 1219

原创 数据大清洗_Pandas库进阶(Pandas时间数据)

没有废话,没有套话,只有干货

2020-06-16 22:14:06 1011 1

原创 数据大清洗_Pandas库进阶(dataframe增删改查)(Pandas统计分析)

目录一、dataframe增删改查1.查询操作2.增加操作3.修改操作4.删除操作二、Pandas统计分析三、案例最火菜品案例菜品缺失值处理案例一、dataframe增删改查1.查询操作上一篇文章含dataframe的直接索引,本文将介绍1个新的索引方式loc与iloc。loc方式:只能使用名称 ---同时索引iloc方式:只可以使用下标import pandas as pd# 直接索引方式:先列后行# 使用loc 、iloc进行同时对行列索引# 加载数据detail = pd.

2020-06-15 21:02:02 841

原创 真香系列_Spring框架

目录一、spring的介绍二、开发流程spring的开发流程spring的生命周期(了解)IOC(控制反转) DI(依赖注入)spring和jdbc的整合一、spring的介绍Spring 框架是一个轻量级的解决方案,可以一站式地构建企业级应用。它是为了解决 企业应用开发的复杂性而创建的。Spring 使用基本的 JavaBean 来完成以前只可能由 EJB 完成的事情。然而,Spring 的用途不仅限于服务器端的开发。从简单性、可测试性和松 耦合的角度而言,任何 Java 应用都可以从 Spri

2020-06-14 20:33:14 254

原创 数据大清洗_Pandas库

目录一、 对 Pandas 库认识1.1 利器之一:DataFrame创建 DataFrame 的三种形式1.2 利器之二:Series创建 Series。1.3 Series 和 DataFrame 的关系二、Pandas 读写文件文本文件读取文本文件保存Excel 文件读取Excel 文件保存三、DataFrame 的查询操作一、 对 Pandas 库认识pandas(panel data & data analysis),是基于 numpy(提供高性能的矩阵运算)专 门用于数据分析的工具,

2020-06-14 17:26:15 524

原创 数据大清洗_Matplotlib 绘制图形

目录一、Matplotlib 数据可视化基础1. Matplotlib 认识2.Matplotlib 绘图流程二、入门案例案例1:(气象图)案例2:(气象图-图形修饰)案例3:(散点图)案例4:(柱状图)案例5:(直方图)案例6:(饼图)案例7:(箱线图)案例8:(k线图)案例9:(雷达图)一、Matplotlib 数据可视化基础1. Matplotlib 认识Matplotlib 是一个 Python 的 2D 绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。他的作用就是将数

2020-06-14 16:53:44 905

原创 数据大清洗_Numpy进阶(数组排序)(数组去重与重复)(数组统计分析)

目录一、数组排序二、数组去重与重复三、数组统计与分析一、数组排序sort 函数是最常用的排序方法。 arr.sort()sort 函数也可以指定一个 axis 参数,使得 sort 函数可以沿着指定轴对数据集进行排序。axis=1 为沿横轴排序; axis=0 为沿纵轴排序。import numpy as np# 创建一个一维的数组# arr = np.array([5, 4, 6, 8, 1, 2, 9])# print('arr:\n', arr)# ## # # 对数组进行排序

2020-06-14 15:48:36 1491

原创 数据大清洗_Numpy进阶(数组运算)(读写文件)

目录一、数组的运算二、读写文件一、数组的运算# 数组的全通用函数 ---是一种能够对数组中所有元素进行操作的函数--以整个数组为输出# 要求:运算的数组 ---必须是同型import numpy as np# 创建两个数组# arr1 = np.array([[1, 2], [2, 1]]) # (2,2)# arr2 = np.arange(1, 5).reshape((2, 2)) # (2,2)# print('arr1:\n', arr1)# print('arr2:\n',

2020-06-14 15:26:08 352

原创 数据大清洗_矩阵的创建与运算

目录一、矩阵创建二、矩阵的运算一、矩阵创建使用 np.mat、np.asmatrix 创建矩阵使用 np.bmat 来组合矩阵 常用import numpy as np# 生成矩阵# 可以使用np.mat np.asmatrix来创建矩阵#np.mat = np.asmatrix 一样的#np.mat 将特殊字符串转化为矩阵# m1 = np.mat('1 2 3;4 5 6;7 8 9')# print(m1)# print(type(m1)) # <class 'num

2020-06-14 14:31:34 211

原创 数据大清洗_Numpy数组基础

目录一、numpy的认识二、数组创建三、数组属性四、数组索引(数组元素查询)五、数组形状变换1、基于 shape 属性变换2、基于reshape属性变换3、基于 np.flatten 与 np.ravel 函数变换六、数组合并与拆分1、数组合并2、数组拆分一、numpy的认识Numpy 是用于数据科学计算的基础,不但能够完成科学计算任务,还能被用作高效地多维数据容器。用于存储和处理大型矩阵。Python 提供了一个 array 模块,和 list 不同,它直接保存数值,但是由于 Python 的 a

2020-06-14 14:27:05 407

原创 数据大清洗_数学基础(矩阵,行列式)

做大数据开发,必须要掌握数学的一些基础知识:线性代数,概率论,微积分

2020-06-14 11:32:46 356

原创 最帅爬虫_scrapy框架中间件的使用

目录一,中间件的概念二,案例2.1 案例(豆瓣读书)一,中间件的概念中间件是 Scrapy 里面的一个核心概念。使用中间件可以在爬虫的请求发起之前或者请 求返回之后对数据进行定制化修改,从而开发出适应不同情况的爬虫。在 Scrapy 框架中有 两种中间件:爬虫中间件和下载中间件。一个框架图重点关注数据的流转—每个组件进出的数据都是怎么流通。对于爬虫而言其实数据主要:url-----在scrapy框架里面将来会封装成一个request对象item—提取出来的数据有两个中间件:功能是由经过他

2020-06-03 19:59:39 266

原创 最帅爬虫_scrapy框架安装与入门

目录一,简介二,安装三,入门一,简介Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便。Scrapy 使用了 Twisted(其主要对手是Tornado)异步网络框架来处理网络通讯,可以加快我们的下载速度,不用自己去实现异步框架,并且包含了各种中间件接口,可以灵活的完成各种需求。scrapy框架的请求流程:ScrapyEngine(引

2020-06-02 22:20:30 168

note_饶家兴.docx

本文描述了python基础语法部门,帮助小白学习。 1、 数据类型怎么来的? 变量:在程序中可以临时存储数据【程序是用来还原生活场景】 类比生活中的场景~生活中的数据各种各样的?在程序中变量中到底应该/都能保存什么样 的数据呢? 道生一、一生二、二生三、三生万物! 生活中的万事万物,都是由基本的数据构成的! 五行元素:金木水火土~ 传统学说中,他们是构成世间万物的基本元素 共同点:世界上存在的各种事物,都是由基本数据组成的!由基本数据构成的!

2020-03-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除