自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 Mysql 中窗口函数的用法

1、窗口函数的基本语法:<窗口函数> over (partition by <用于分组的列名> order by <用于排序的列名>)<窗口函数>的位置,可以放以下两种函数:1) 专用窗口函数,包括后面要讲到的rank, dense_rank, row_number等专用窗口函数。 rank函数、dense_rank函数, row_number函数三者的区别在于排名时遇到同样大小的值处理,如下图所示...

2022-04-08 20:31:41 563

原创 用户数据分析

第一部分:数据类型的处理(预处理)数据加载 字段定义: user_id:用户ID order_dt:购买日期 order_product:购买产品的数量 order_amount:购买金额 观察数据 查看数据的数据类型 数据中是否存在缺失值 将order_dt转换成时间类型 查看数据的统计描述 计算所有用户购买商品的平均数量 计算所有用户购买商品的平均花费 在源数据中添加一列表示月份:astype('datetime64[M]')

2022-02-26 23:44:18 1022

原创 MySql数据库的学习——day05表的约束

常见的约束 非空约束,not null 唯一约束,unique 主键约束,primary key 外键约束,foreign key

2021-06-21 17:37:25 123

原创 MySql数据库的学习——day04 表

1.创建表2.增加/删除/修改表结构3.添加、修改和删除4.创建表加入约束常见的约束 非空约束,not null 唯一约束,unique 主键约束,primary key 外键约束,foreign key

2021-06-21 13:42:49 73

原创 MySql数据库的学习——day03 连接查询

连接查询:也可以叫跨表查询,需要关联多个表进行查询

2021-06-20 10:36:49 80

原创 2021-06-20 操作mysql数据库的常用命令

常用命令1)连接MySql mysql -uroot -p<密码>2)查看现有的数据库mysql>show databases;3) 创建“bjpowernode”数据库mysql> create database bjpowernode;4) 选择数据库mysql> use bjpowernode5) 导入数据mysql>source D:\ bjpowernode.sql6) 删除数据库(这里不要做!)mysq...

2021-06-20 01:12:31 65

原创 去除重复记录——distinct在sql语句中的用法

distinct 可以去除查询结果中的重复值,在select语句中 distinct 只能出现所有字段的前面案例1:select distinct job from emp;select distinct ename ,job from emp案例2:统计工作岗位的数量?mysql> select count(distinct job) from emp;+---------------------+| count(distinct job) |+----------.

2021-04-29 15:09:21 492

原创 MySql数据库的学习——day02数据查询语句DQL

数据排序select 字段 3 from 表名 1 where 条件 2 order by .... 4 order by是最后执行的。分组函数 count 计数 sum 求和 av...

2021-04-29 00:27:26 172

原创 MySql数据库的学习——day01、mysql的基本操作

1.打开mysql数据库>mysql -uroot -p回车>输入密码2.卸载MySql(必须清除干净,否则影响二次安装)1.卸载mysql应用程序 2.手动清楚安装目录下(C:\Program Files\MySQL)的mysql文件 3.手动删除progrData(隐藏) 目录下的mysql3.数据库概述sql、DB、DBMS分别是什么,他们之间有什么关系?DB:DataBase (数据库,数据库实际上在硬盘上以文件的形式存在)DBMS:DataB

2021-04-26 22:00:44 201

原创 科学数据库(Pandas)——第六节 Pandas时间序列

时间序列为什么要学习pandas中的时间序列不管在什么行业,时间序列都是一种非常重要的数据形式,很多统计数据以及数据的规律也都和时间序列有着非常重要的联系,而在pandas中处理时间序列是非常简单的生成一段时间范围pd.date_range(start=None, end=None, periods=None, freq=‘D’)start 开始时间 end 结束时间 freq 频率 periods 周期 (能够生成从start开始(或者end结尾),频率为fr...

2021-04-22 23:50:04 194 1

原创 python中时间日期格式化

python中时间日期格式化符号:%y 两位数的年份表示(00-99) %Y 四位数的年份表示(000-9999) %m 月份(01-12) %d 月内中的一天(0-31) %H 24小时制小时数(0-23) %I 12小时制小时数(01-12) %M 分钟数(00-59) %S 秒(00-59) %a 本地简化星期名称 %A 本地完整星期名称 %b 本地简化的月份名称 %B 本地完整的月份名称 %c 本地相应的日期表示和时间表示 %j 年内的一天(001-366) %p 本

2021-04-22 19:29:31 170

原创 pandas 中如何将数据输出到本地

pandas to_csv()方法的使用import pandas as pdfile_path = "./911.csv"df = pd.read_csv(file_path)#导入需要处理的文本tp=df["title"].str.split(":")。 #从df中选取需要的数据tp.to_csv('911副本.csv') #保存在当前目录下tp.to_csv('C:\Users\86181\Desktop.csv') #绝对路径下的保存...

2021-04-20 17:04:37 548

原创 科学数据库(Pandas)——第五节 数据的分组和聚合

pandas中对数据进行分组的操作:groupby例如:grouped=df.groupby(by="columns_name") #df中的数据按照"columns_name"这列进行分组grouped是一个DataFrameGroupBy对象,是可迭代的 grouped中的每一个元素是一个元组,元组里面包含的是(索引(分组的值),分组之后的DataFrame注意:只对数据集进行分组操作,将不会显示结果,只会生成一个分组的对象,只有分组后进行聚合运算才有实际结果...

2021-02-09 23:43:31 366

原创 科学数据库(Pandas)——第四节 数据合并之join和merge

数据合并之joinjoin:默认情况下他是把行索引相同的数据合并到一起数据合并之mergemerge:按照指定的列把数据按照一定的方式合并到一起

2021-01-30 23:09:15 375

原创 科学数据库(Pandas)——第三节 字符串离散化案例

问题:对于这一组电影数据,如果我们希望统计电影分类(genre)的情况,应该如何处理数据?思路:重新构造一个全为0的数组,列名为分类,如果某一条数据中分类出现过,就让0变为1#coding=utf-8import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfile_path="MDB-Movie-Data.csv"df=pd.read_csv(file_path)#统计分类的列表

2021-01-28 22:58:39 135

原创 科学数据库(Pandas)——第二节 pandas之DataFrame

目录DataFrame的创建DataFrame基本操作pandas之locpandas之ilocpandas之布尔索引缺失数据的处理pandas常用统计方法DataFrame的创建方法一:向DataFrame传入数组可以指定索引的名称:方法二:通过字典传入DataFrameDataFrame基本操作#coding=utf-8import pandas as pddf = pd.read_csv("dogNames2.csv".

2021-01-23 21:13:54 121

原创 科学数据库(Pandas)——第一节:pandas之Series类型

目录Series的本质Series的创建Series的切片和索引pandas中的缺失值Series具有的where方法Series的本质Series 是一维的数组型对象,本质上由两个数组构成,一个数组构成对象的键(index,索引),一个数组构成对象的值(values),键->值Series的创建先导入pandas模块import pandas as pd方法一:向Series里传入列表(index不写,默认从0开始),index可以设置指定值,但是i.

2021-01-20 18:59:31 158

原创 数据科学库(HM)_第3节_Numpy

什么是numpy?一个在Python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科学计算库的基础库,多用于在大型、多维数组上执行数值运算

2021-01-19 17:21:24 140

原创 数据科学库(HM)_第2节_matplotlib绘图

matplotlibmatplotlib能够绘制折线图,散点图,柱状图,直方图,箱线图,饼图等。我们需要知道不同的统计图到底能够表示出什么,以此来决定选择哪种统计图来更直观的呈现我们的数据。对比常用统计图折线图:以折线的上升或下降来表示统计数量的增减变化的统计图特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)直方图:由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据范围,纵轴表示分布情况。特点:绘制连续性的数据,展示一组或者多组数据的分布状况(统计

2020-12-17 15:51:31 210

原创 数据科学库(HM)——第一节数据分析介绍&matplotlib

数据分析定义:数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动。为什么要学数据分析?python数据科学的基础(包含pandas、numpy、matplotlib等python库) 机器学习课程的基础数据分析的流程提出问题 准备数据 整理、分析数据 获得结论 成果可视化matplotlibmatplotlib是最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建为什么学习matplot

2020-12-12 00:50:22 181

原创 2020-12-06 DAY11 模块

一、模块化设计理念1.模块和包的进化史1. Python 程序由模块组成。一个模块对应 python 源文件,一般后缀名是:.py。 2. 模块由语句组成。运行 Python 程序时,按照模块中语句的顺序依次执行。 3. 语句是 Python 程序的构造单元,用于创建对象、变量赋值、调用函数、控制语句等。2.模块化编程的优势:便于将一个任务分解成多个模块,实现团队协同开发,完成大规模程序 实现代码复用。一个模块实现后,可以被反复调用。 可维护性增强。3.模块化编程的流程...

2020-12-07 18:06:21 77

原创 2020-12-01 DAY10 文件操作

文件操作文本文件和二进制文件创建文件对象 open()

2020-12-07 18:04:55 105

原创 2020-11-25 DAY 9 处理异常和错误

异常机制的本质异常指程序运行过程中出现的非正常现象。例如用户输入错误、除数为零、需 要处理的文件不存在、数组下标越界等。所谓异常处理:就是指程序在出现问题时依然可以正确的执行剩余的程序,而 不会因为异常而终止程序执行。异常类:python 中,引进了很多用来描述和处理异常的类,称为异常类。它包含了该类异常的信息和异常进行处理的方法。python中内建异常类的继承层次:处理异常python 中一切都是对象,异常也采用对象的方式来处理。处理过程:抛出异常:在执行一个方法时,如果发

2020-11-29 16:34:12 186

原创 2020-11-05 DAY8 面向对象(二)

面向对象进阶面向对象三大特性:继承、封装(隐藏)、多态。封装(隐藏)继承多态

2020-11-08 17:21:05 216

原创 2020-10-21 DAY 7 面向对象一

简介面向对象(Object oriented Programming,OOP)编程的思想主要是针对大型 软件设计而来的。面向对象编程使程序的扩展性更强、可读性更好,使的编程可以像搭 积木一样简单。面向对象编程将数据和操作数据相关的方法封装到对象中,组织代码和数据的方式 更加接近人的思维,从而大大提高了编程的效率。面向对象思考方式遇到复杂问题,先从问题中找名词(面向过程更多的是找动词),然后确立这些名词哪 些可以作为类,再根据问题需求确定的类的属性和方法,确定类之间的关系。类和对象的关系类

2020-10-25 00:19:52 229

原创 2020-10-21 DAY6 函数用法

函数简介函数是可重用的程序代码块。函数的作用,不仅可以实现代码的复用,更能实现代码的 一致性。一致性指的是,只要修改函数的代码,则所有调用该函数的地方都能得到体现。函数的基本概念1. 一个程序由一个个任务组成;函数就是代表一个任务或者一个功能。2. 函数是代码复用的通用机制。Python 函数的分类Python 中函数分为如下几类:1. 内置函数 我们前面使用的 str()、list()、len()等这些都是内置函数,我们可以拿来直接使用。2. 标准库函数 我们可以通过 im

2020-10-21 00:41:02 327

原创 2020-10-13 DAY 5 流程控制语句

控制语句前面学习的变量、数据类型(整数、浮点数、布尔)、序列(字符串、列表、元组、字典、集合),可以看做是数据的组织方式。数据可以看做是“砖块”!流程控制语句是代码的组织方式,可以看做是“混凝土”。一个完整的程序,离不开“砖块”,也离不开“混凝土”。他们的组合,才能让我们建立从小到“一个方法”,大到“操作系统”,这样各种各样的“软件”。选择结构选择结构通过判断条件是否成立,来决定执行哪个分支。选择结构有多种形式,分为:单分 支、双分支、多分支。条件表达式详解在选择和循环结构中,条

2020-10-14 03:26:38 178 1

原创 2020-10-09 DAY 4 序列

目录序列列表 list列表的创建列表的常见操作元组tuple元组的创建元组的元素访问和计数字典字典的创建字典元素的常用操作​序列解包字典核心底层原理集合序列序列是一种数据存储方式,用来存储一系列的数据。在内存中,序列就是一块用来存放多个值的连续的内存空间。由于 Python3 中一切皆对象,在内存中实际是按照如下方式存储的:a = [10,20,30,40]从图示中,我们可以看出序列中存储的是整数对象的地址,而不是整数对象的值..

2020-10-11 00:23:10 160

原创 2020-09-25 DAY3 字符串的介绍及用法

字符串基本特点字符串的本质是:字符序列。Python 的字符串是不可变的,我们无法对原字符串做任 何修改。但可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。字符串的编码Python3 的字符 默认就是 16 位 Unicode 编码(可以表示世界上任何书面语言的字符),ASCII 码是 Unicode 编码的子集。内置函数ord()——把字符串转换成对应的Unicode码内置函数chr()——把十进制的Unicode码转换成对应的字符串字符串的创建我们可以

2020-09-25 22:58:08 203

原创 2020-09-24 DAY2 python编程基础概念

变量的声明和赋值变量的声明和赋值用于将一个变量绑定到一个对象上,格式如下: 变量名 = 表达式 最简单的表达式就是字面量。比如:a = 123 。 运行过程中,解释器先运行右边的表达式, 生成一个代表表达式运算结果的对象;然后,将这个对象地址赋值给左边的变量。...

2020-09-25 00:49:46 364

原创 2020-09-23 DAY1 python介绍

目录python 介绍初识程序第一个python源程序源码实操作业:源码效果图编程基础概念Python 程序的构成程序基本格式1. 恰当的空格,缩进问题2. Python 区分大小写3. 注释4. 使用\行连接符对象Python 中,一切皆对象。对象有三个特征:标识(identity)类型(type)值(value)对象的本质就是:一个内存块,拥有特定的值,支持特定类型的相关操作。引用定义:python中变量也...

2020-09-24 01:03:03 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除