自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 黑马SQL笔记 -基础篇 - 5.事务

上述的这种方式,我们是修改了事务的自动提交行为, 把默认的自动提交修改为了手动提交, 此时我们执行的DML语句都不会提交, 需要手动的执行commit进行提交。为了解决并发事务所引发的问题,在数据库中引入了事务隔离级别。事务是一组操作的集合,它是一个不可分割的工作单位。上述就是事务的四大特性,简称ACID。

2022-09-30 20:32:26 173 1

原创 黑马SQL笔记 -基础篇 -4.多表查询

对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。子查询返回的结果是多行多列,这种子查询称为表子查询。常用的操作符:= 、 、IN 、NOT IN。:当前表与自身的连接查询,自连接必须使用表别名。:相当于查询A、B交集部分数据。

2022-09-30 20:31:45 258

原创 黑马SQL笔记 -基础篇 -3. 约束

添加了外键之后,再删除父表数据时产生的约束行为,我们就称为删除/更新行为。具体的删除/更新行为有以下几种。外键:用来让两张表的数据之间建立连接,从而保证数据的一致性和完整性。约束是作用于表中字段上的,可以在创建表/修改表的时候添加约束。

2022-09-26 16:35:30 201

原创 黑马SQL笔记 - 基础篇 - 2. 函数

【代码】黑马SQL笔记 - 基础篇 - 2. 函数。

2022-09-26 16:34:14 137

原创 黑马SQL笔记 - 基础篇 - 1. SQL

增加路径 C:\Program Files\MySQL\MySQL Server 8.0\bin。多个权限之间,使用逗号分隔;授权时,数据库名和表名可以使用 * 进行通配,代表所有。右键‘@localhost’–>new–>scheam。右键表/数据库–>new–>query console。: where > 聚合函数 > having。右键表–>new–>modify table。管理数据库用户、控制数据库的访问权限。右键表–>new–>table。对数据库中表中的数据操作。

2022-09-26 16:32:59 491

原创 Pandas - 11.2 datetime

基于日期数据获取子集。

2022-08-02 10:35:18 125

原创 Pandas - 10.3 单个分组聚合

grouped中的元素sex_group是一个元组,sex_group的第一个元素是字符串(类似于‘键’),第二个元素是DataFrame(类似于‘值’)针对可能计算的列计算,删除不能计算的列。

2022-07-31 16:47:10 263

原创 Pandas - 10.2 转换与过滤

转换与聚合成单个值的计算不同,数据转换后数量不会变,比如标准化,只是在不同的类中进行标准化。对比分组标准化和不分组标准化,两个分组标准化结果类似,但不分组区别很大以缺失值填充为例,用组内平均值代替,而不是整个数据的平均值。比如男性和女性的消费能力不同,区分男女计算平均值代替缺失值更加合理。...

2022-07-30 22:24:31 278

原创 Pandas - 10.4 多个分组聚合

多级索引Serise的形式,r若要执行另一个groupby操作,必须传入level参数指明多级索引的级别。传入level=[0,1,2]分别指定第一级,第二级,第三级索引。统计每次重复的干预次数,干预时间和治疗效果,这里随意计算ig_type,因为只需要一个值来得到分组的观测数。对多个指标分组的结果进行计算,聚合计算的结果是一个比较奇怪的DataFrame。按照多个指标分组的情况,与单个指标分组差别不大,在获取分组时需要用元组。结果是多级索引Serise的形式,可以用reset_index()铺平。...

2022-07-30 22:17:54 759

原创 Pandas - 10.1 聚合groupby-agg/aggreagte

quantile(q=0.25)/np.percentile(q=0.25)较小四分位数。quantile(q=0.75)/np.percentile(q=0.75)较大四分位数。quantile(q=0.5)/np.percentile(q=0.5)中位数。带有多个参数的自定义聚合函数,第一个参数是值序列,其他参数作为关键字传入agg。count/np.count_nonzero统计频数(不包含NaN值)sem/scipy.stats.sem平均值的无偏方差。...

2022-07-20 17:12:41 945

原创 Pandas - 9.2 向量化函数

对于非向量化的函数,使用np.vectorize创建新函数实现向量化(对于没有某个函数的源代码时)python装饰器把函数向量化,无需创建新函数(对于函数是自定义的)当函数相当简单时,可以写在apply方法中。...

2022-07-18 20:53:37 645

原创 Pandas - 9.1 apply应用

titanic=sns.load_dataset(‘titanic’)命令会因为网络原因报错。带有参数的函数,需要额外指定参数,函数的第一个变量是Serise的元素。需求计算titanic每一行或每一列的完整案例(不含缺失值)的百分比。cache=True时,会根据data_home的路径来加载数据集。DataFrame需要指定按行还是按列应用函数。需要手动下载,然后从本地导入。...

2022-07-18 14:58:11 359

原创 python 字符串

python 字符串方法

2022-07-14 15:52:25 325

原创 python 全局莫兰指数和局部莫兰指数

用python实现莫兰指数计算

2022-07-14 10:50:47 5598 9

原创 Pandas - 5.缺失值处理

判断缺失值isnull()notnull()import pandas as pdfrom numpy import NaN,NAN,nanimport numpy as npprint(pd.isnull(NaN))print(pd.isnull(NAN))print(pd.isnull(nan))print(pd.isnull(True))TrueTrueTrueFalseprint(pd.notnull(NaN))print(pd.notnull(NAN))p

2022-05-22 17:47:02 827

原创 Pandas - 4. 组合 concat 和 merge

concat()函数当相同类型的表被分成好多个部分,需要将各部分按行或按列连接按行连接concat,可以连接多个append,只追加单个import pandas as pddf1 = pd.read_csv('data/concat_1.csv')df2 = pd.read_csv('data/concat_2.csv')df3 = pd.read_csv('data/concat_3.csv')print(df1)print(df2)print(df3) A

2022-05-22 13:49:14 408

原创 Pandas - 2.抽取行列

import pandas as pddf = pd.read_csv('data/gapminder.tsv',sep='\t')print(df.head()) country continent year lifeExp pop gdpPercap0 Afghanistan Asia 1952 28.801 8425333 779.4453141 Afghanistan Asia 1957 30.332 9240

2022-05-21 14:45:05 249

原创 Pandas - 3.Series和DataFrame

import pandas as pd创建Series传入列表s = pd.Series([175, 65, 25])print(s)0 1751 652 25dtype: int64指定索引indexs = pd.Series([175, 65, 25], index=['height', 'weight', 'age'])print(s)height 175weight 65age 25dt

2022-05-21 14:33:31 158

原创 Pandas 分组 groupby

import pandas as pddf = pd.read_csv('data/gapminder.tsv',sep='\t')print(df.head())# 输出结果 country continent year lifeExp pop gdpPercap0 Afghanistan Asia 1952 28.801 8425333 779.4453141 Afghanistan Asia 1957 30.33

2022-05-21 13:55:43 272

原创 python LDA主题模型

准备数据使用路透社新闻数据的一个子集:R8,包含8类新闻。本文直接读取清洗后的R8,清洗内容包含:去掉特殊字符,标点符号,停用词和低频词,且英文文本不需要分词。doc_list = []f = open('R8.clean.txt', 'r')lines = f.readlines()for line in lines: doc_list.append(line.strip())f.close()print(doc_list[0])champion products appro

2022-05-15 16:30:08 2233

原创 anaconda安装虚拟环境和python安装各种包

pip 安装设置pip下载位置(在创建虚拟环境时安装新的python,用pip命令下载,就安装在虚拟环境中)参考 https://blog.csdn.net/mukvintt/article/details/80908951pip卸载包pip uninstall packagenamepip安装包pip install packagenamepip升级包pip install --upgrade packagename查看指定的安装包信息pip show packagename

2022-05-15 15:03:06 2592

原创 Pyinstaller 打包 python 程序

参考网址:https://zhuanlan.zhihu.com/p/370914926用anaconda的conda命令创建虚拟环境,因为打包时会把当前环境下的所有包都打包,生成的文件还会很大,所有穿甲虚拟环境,只装用到的包激活虚拟环境,在虚拟环境中安装所需要的包和pyinstaller包准备好打包的文件,包含图标.ico文件,python程序和所需的其他文件,放在一个文件夹内用Pyinstaller命令打包删除虚拟环境虚拟环境准备conda create -n tempenv pytho

2022-05-12 14:36:44 450

原创 Pandas 1.数据的读取和保存

读取数据pd.read_excel()读取.xlsx文件文件名可以包含中文读取的内容有中文不会乱码pd.read_pickle()读取.pickle文件文件名可以有中文读取的内容有中文不会乱码pd.read_csv()读取.csv文件文件名不可以有中文(会报错)关于中文乱码:可以尝试 encoding=‘gbk’读取.csv文件报错的部分原因,在Excel中将.excel另存为.csv文件时:选择 CSV UTF-8 格式,有无中文都不会出错(举例文件名末尾csv_

2022-04-30 10:54:00 2699

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除