陈天睡懒觉.-CSDN博客

原创黑马SQL笔记 -基础篇 - 5.事务

上述的这种方式，我们是修改了事务的自动提交行为, 把默认的自动提交修改为了手动提交, 此时我们执行的DML语句都不会提交, 需要手动的执行commit进行提交。为了解决并发事务所引发的问题，在数据库中引入了事务隔离级别。事务是一组操作的集合,它是一个不可分割的工作单位。上述就是事务的四大特性，简称ACID。

2022-09-30 20:32:26 173 1

原创黑马SQL笔记 -基础篇 -4.多表查询

对于union查询，就是把多次查询的结果合并起来，形成一个新的查询结果集。子查询返回的结果是一行（可以是多列），这种子查询称为行子查询。子查询返回的结果是一列（可以是多行），这种子查询称为列子查询。子查询返回的结果是多行多列，这种子查询称为表子查询。常用的操作符：= 、、IN 、NOT IN。：当前表与自身的连接查询，自连接必须使用表别名。：相当于查询A、B交集部分数据。

2022-09-30 20:31:45 258

原创黑马SQL笔记 -基础篇 -3. 约束

添加了外键之后，再删除父表数据时产生的约束行为，我们就称为删除/更新行为。具体的删除/更新行为有以下几种。外键：用来让两张表的数据之间建立连接，从而保证数据的一致性和完整性。约束是作用于表中字段上的，可以在创建表/修改表的时候添加约束。

2022-09-26 16:35:30 201

原创黑马SQL笔记 - 基础篇 - 2. 函数

【代码】黑马SQL笔记 - 基础篇 - 2. 函数。

2022-09-26 16:34:14 137

增加路径 C:\Program Files\MySQL\MySQL Server 8.0\bin。多个权限之间,使用逗号分隔;授权时，数据库名和表名可以使用 * 进行通配，代表所有。右键‘@localhost’–>new–>scheam。右键表/数据库–>new–>query console。: where > 聚合函数 > having。右键表–>new–>modify table。管理数据库用户、控制数据库的访问权限。右键表–>new–>table。对数据库中表中的数据操作。

2022-09-26 16:32:59 491

原创 Pandas - 11.2 datetime

基于日期数据获取子集。

2022-08-02 10:35:18 125

原创 Pandas - 10.3 单个分组聚合

grouped中的元素sex_group是一个元组，sex_group的第一个元素是字符串（类似于‘键’），第二个元素是DataFrame（类似于‘值’）针对可能计算的列计算，删除不能计算的列。

2022-07-31 16:47:10 263

原创 Pandas - 10.2 转换与过滤

转换与聚合成单个值的计算不同，数据转换后数量不会变，比如标准化，只是在不同的类中进行标准化。对比分组标准化和不分组标准化，两个分组标准化结果类似，但不分组区别很大以缺失值填充为例，用组内平均值代替，而不是整个数据的平均值。比如男性和女性的消费能力不同，区分男女计算平均值代替缺失值更加合理。...

2022-07-30 22:24:31 278

原创 Pandas - 10.4 多个分组聚合

多级索引Serise的形式,r若要执行另一个groupby操作，必须传入level参数指明多级索引的级别。传入level=[0,1,2]分别指定第一级，第二级，第三级索引。统计每次重复的干预次数，干预时间和治疗效果，这里随意计算ig_type，因为只需要一个值来得到分组的观测数。对多个指标分组的结果进行计算，聚合计算的结果是一个比较奇怪的DataFrame。按照多个指标分组的情况,与单个指标分组差别不大，在获取分组时需要用元组。结果是多级索引Serise的形式,可以用reset_index()铺平。...

2022-07-30 22:17:54 759

原创 Pandas - 10.1 聚合groupby-agg/aggreagte

quantile(q=0.25)/np.percentile(q=0.25)较小四分位数。quantile(q=0.75)/np.percentile(q=0.75)较大四分位数。quantile(q=0.5)/np.percentile(q=0.5)中位数。带有多个参数的自定义聚合函数,第一个参数是值序列，其他参数作为关键字传入agg。count/np.count_nonzero统计频数（不包含NaN值）sem/scipy.stats.sem平均值的无偏方差。...

2022-07-20 17:12:41 945

原创 Pandas - 9.2 向量化函数

对于非向量化的函数，使用np.vectorize创建新函数实现向量化(对于没有某个函数的源代码时)python装饰器把函数向量化，无需创建新函数（对于函数是自定义的）当函数相当简单时，可以写在apply方法中。...

2022-07-18 20:53:37 645

原创 Pandas - 9.1 apply应用

titanic=sns.load_dataset(‘titanic’)命令会因为网络原因报错。带有参数的函数，需要额外指定参数，函数的第一个变量是Serise的元素。需求计算titanic每一行或每一列的完整案例（不含缺失值）的百分比。cache=True时，会根据data_home的路径来加载数据集。DataFrame需要指定按行还是按列应用函数。需要手动下载，然后从本地导入。...

2022-07-18 14:58:11 359

原创 python 字符串

python 字符串方法

2022-07-14 15:52:25 325

原创 python 全局莫兰指数和局部莫兰指数

用python实现莫兰指数计算

2022-07-14 10:50:47 5598 9

原创 Pandas - 5.缺失值处理

判断缺失值isnull()notnull()import pandas as pdfrom numpy import NaN,NAN,nanimport numpy as npprint(pd.isnull(NaN))print(pd.isnull(NAN))print(pd.isnull(nan))print(pd.isnull(True))TrueTrueTrueFalseprint(pd.notnull(NaN))print(pd.notnull(NAN))p

2022-05-22 17:47:02 827

原创 Pandas - 4. 组合 concat 和 merge

concat()函数当相同类型的表被分成好多个部分，需要将各部分按行或按列连接按行连接concat，可以连接多个append，只追加单个import pandas as pddf1 = pd.read_csv('data/concat_1.csv')df2 = pd.read_csv('data/concat_2.csv')df3 = pd.read_csv('data/concat_3.csv')print(df1)print(df2)print(df3) A

2022-05-22 13:49:14 408

原创 Pandas - 2.抽取行列

import pandas as pddf = pd.read_csv('data/gapminder.tsv',sep='\t')print(df.head()) country continent year lifeExp pop gdpPercap0 Afghanistan Asia 1952 28.801 8425333 779.4453141 Afghanistan Asia 1957 30.332 9240

2022-05-21 14:45:05 249

原创 Pandas - 3.Series和DataFrame

import pandas as pd创建Series传入列表s = pd.Series([175, 65, 25])print(s)0 1751 652 25dtype: int64指定索引indexs = pd.Series([175, 65, 25], index=['height', 'weight', 'age'])print(s)height 175weight 65age 25dt

2022-05-21 14:33:31 158

原创 Pandas 分组 groupby

import pandas as pddf = pd.read_csv('data/gapminder.tsv',sep='\t')print(df.head())# 输出结果 country continent year lifeExp pop gdpPercap0 Afghanistan Asia 1952 28.801 8425333 779.4453141 Afghanistan Asia 1957 30.33

2022-05-21 13:55:43 272

原创 python LDA主题模型

准备数据使用路透社新闻数据的一个子集：R8，包含8类新闻。本文直接读取清洗后的R8，清洗内容包含：去掉特殊字符，标点符号，停用词和低频词，且英文文本不需要分词。doc_list = []f = open('R8.clean.txt', 'r')lines = f.readlines()for line in lines: doc_list.append(line.strip())f.close()print(doc_list[0])champion products appro

2022-05-15 16:30:08 2233

原创 anaconda安装虚拟环境和python安装各种包

pip 安装设置pip下载位置（在创建虚拟环境时安装新的python，用pip命令下载，就安装在虚拟环境中）参考 https://blog.csdn.net/mukvintt/article/details/80908951pip卸载包pip uninstall packagenamepip安装包pip install packagenamepip升级包pip install --upgrade packagename查看指定的安装包信息pip show packagename

2022-05-15 15:03:06 2592

原创 Pyinstaller 打包 python 程序

参考网址：https://zhuanlan.zhihu.com/p/370914926用anaconda的conda命令创建虚拟环境，因为打包时会把当前环境下的所有包都打包，生成的文件还会很大，所有穿甲虚拟环境，只装用到的包激活虚拟环境，在虚拟环境中安装所需要的包和pyinstaller包准备好打包的文件，包含图标.ico文件，python程序和所需的其他文件，放在一个文件夹内用Pyinstaller命令打包删除虚拟环境虚拟环境准备conda create -n tempenv pytho

2022-05-12 14:36:44 450

原创 Pandas 1.数据的读取和保存

读取数据pd.read_excel()读取.xlsx文件文件名可以包含中文读取的内容有中文不会乱码pd.read_pickle()读取.pickle文件文件名可以有中文读取的内容有中文不会乱码pd.read_csv()读取.csv文件文件名不可以有中文(会报错)关于中文乱码：可以尝试 encoding=‘gbk’读取.csv文件报错的部分原因,在Excel中将.excel另存为.csv文件时:选择 CSV UTF-8 格式，有无中文都不会出错（举例文件名末尾csv_

2022-04-30 10:54:00 2699

Aaron_ChenShenyu的博客