自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(111)
  • 收藏
  • 关注

原创 【python基础】—字符串str的的使用方法

字符串是python中最常用的数据类型,本文主要介绍字符串的使用方法。

2024-01-31 17:25:01 2612

原创 【python基础】—python string和bytes类型互相转换(decode()/str()/encode()/bytes())

python string和bytes类型互相转换(decode()/str()/encode()/bytes())

2024-01-31 15:04:58 1810

原创 【python基础】类与类的实例化对象、类方法与类的属性、类实例化的方法与属性、初始化函数、类的继承与重写、@property、私有属性与方法

类与类的实例化对象、类方法与类的属性、类实例化的方法与属性、初始化函数、类的继承与重写、@property、私有属性与方法

2024-01-31 11:29:44 5667 3

原创 【python应用】—利用python构造邮件、解析邮件、发送邮件、接收邮件(email、smtplib、imaplib模块)

利用python构造邮件、解析邮件、发送邮件、接收邮件(email、smtplib、imaplib模块)

2024-01-23 18:05:12 3059

原创 【python报错】Jupyter Notebook读取文件IOPub数据率超出怎么修改`--NotebookApp.iopub_data_rate_limit`

Jupyter Notebook读取文件IOPub数据率超出怎么修改`--NotebookApp.iopub_data_rate_limit`

2024-01-19 11:48:13 780

原创 【python基础】—可变可迭代对象修改的问题及浅拷贝深拷贝的问题

可变可迭代对象修改的问题及浅拷贝深拷贝的问题

2023-12-22 11:28:47 1074

原创 【python基础】—内置排序函数sort()、sorted()、reversed()

本文主要介绍python内置排序函数sort()/sorted()/reversed()的用法以及sort()与sorted()用法的区别。

2023-11-22 10:19:05 11948

原创 【python基础】python可变序列与不可变序列

本文主要讲可变序列与不可变序列一些简单的应用。

2023-11-22 10:13:38 1361

原创 【python基础】random模块常用方法讲解

Python标准库中的random函数,可以生成随机浮点数、整数、字符串,甚至帮助你随机选择列表序列中的一个元素,打乱一组数据等。本文主要讲random模块下面相关函数random();uniform();randint();randrange();choice();shuffle();sample()的用法。

2023-11-22 10:09:17 331

原创 【hive】- 使用insert into/insert overwrite插入数据到静态分区、动态分区、动静态分区

使用insert into/insert overwrite插入数据到静态分区、动态分区、动静态分区

2023-11-15 16:49:41 16943 4

原创 【hive遇到的坑】—使用 is null / is not null 对string类型字段进行null值过滤无效

使用 is null / is not null 对string类型字段进行null值过滤无效

2023-11-15 10:07:37 1124

原创 【python基础】时间模块的time的下面的方法使用解析

时间模块的time的下面的方法使用解析

2023-11-08 10:10:44 628

原创 【python基础】python切片—如何理解[-1:],[:-1],[::-1]的用法

本文主要讲对序列对象的切片索引及如何理解[-1:],[:-1],[::-1]的用法

2023-11-03 17:32:22 8205 2

原创 【python基础】format格式化函数的使用

format格式化函数的使用

2023-11-02 15:39:34 4251

原创 【python基础】魔法参数*args, **kwargs的使用

本文主要讲魔法参数 *args和 **kwargs 的如何使用,如何将不定数量的参数传递给一个函数和调用一个函数。

2023-11-02 15:19:39 4058 1

原创 【python基础】—内置模块os常用功能介绍

python基础—内置模块os常用功能介绍

2023-09-22 17:56:06 493

原创 【linux基础】— linux下的source filename.sh及与sh filename.sh、./filename.sh命令的区别

linux下的source filename.sh及与sh filename.sh、./filename.sh命令的区别

2023-09-22 17:55:09 285 1

原创 【python数据分析基础】—对列操作:获取DataFrame不同的类型columns

在DataFrame进行数据分析时,我们时常会想对DataFrame的所有列进行数据清洗操作,比如转换不同字段的数据类型,但如果DataFrame字段比较多,一列列数据引用进行数据处理显现效率比较低,使用DataFrame.columns方法获取的结果可以观察到列名和数据类型,但是无法直接对得到的结果进行操作。因此本文主要介绍返回DataFrame的列名的不同类型,我们对此进行操作。

2023-09-21 09:18:08 1490

原创 【python数据分析基础】—对列操作:调整DataFrame的列顺序

在数据处理过程中,经常需要将列按照一定的要求进行排序,以方便展示。本文主要几种调整列顺序的常用方法。

2023-09-21 09:17:10 5280

原创 【python数据分析基础】—pandas中loc()与iloc()的介绍与区别

pandas中loc()与iloc()的介绍与区别

2023-09-20 16:16:32 22846

原创 【python基础】—函数def()的定义与调用、参数、return返回值及变量作用域

【python基础】—函数def()的定义与调用、参数、return返回值及变量作用域

2023-09-19 15:23:27 17597 4

原创 python报错—使用.str.contains()方法替换某一列报错:AttributeError: ‘str‘ object has no attribute ‘str‘及解决方案

python报错—使用.str.contains()方法替换某一列报错:AttributeError: 'str' object has no attribute 'str'及解决方案

2023-09-15 17:02:47 4945

原创 python报错—为什么用apply方法使用.replace()方法报错TypeError: str.replace() takes no keyword arguments

为什么用apply方法使用.replace()方法报错TypeError: str.replace() takes no keyword arguments、.str.replace()方法会报错AttributeError: ‘str’ object has no attribute ‘str’?

2023-09-15 14:59:47 1700

原创 【hive】行转列—explode()/posexplode()/lateral view 函数使用场景

【hive】行转列—explode()/posexplode()/lateral view 函数使用场景

2023-09-13 15:22:30 4254 2

原创 【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景

【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景

2023-09-13 15:22:07 16397 2

原创 【hive】—原有分区表新增加列(alter table xxx add columns (xxx string) cascade;)

原有分区表新增加列(alter table xxx add columns (xxx string) cascade;)

2023-09-11 17:08:01 2883

原创 python可视化模块—快速利用matplot绘制图表

本文主要讲python可视化模块matplotlib的绘图及用matplotlib绘画常用绘图

2023-09-08 17:48:04 2153

原创 【python基础】——Anaconda下包更新的坑及安装与卸载、及安装后Jupyter Notebook没反应的解决方法

本文为个人复盘,关于怎么一步步从最初更新包,走到anaconda安装与卸载、及重新安装后Jupyter Notebook运行不生效的解决方法。

2023-09-08 17:44:30 1276

原创 python数据分析基础—取某个字符的前几个字符

在进行数据分析时,有时候我们需要提取单列的前几个字符串进行分析。本文主要讲述针对这种情况处理方法。

2023-09-05 15:39:53 2439

原创 python数据分析基础—pandas中set_index()、reset_index()的使用

python数据分析基础—pandas中set_index()、reset_index()的使用

2023-09-01 10:18:31 12269

原创 python数据分析基础—Pandas数据类型转换

利用Pandas进行数据清洗,探索时,常常会涉及的数据类型的转换,发现某些特征列不是Pandas所能处理的类型,因此如何将Python基本数据类型转化为Pandas所能处理的数据类型,本文主要介绍三种方法,astype()、自定义函数及to_numeric()转化为Pandas所能处理的数据类型。

2023-08-31 10:58:18 4401

原创 Pandas数据分析基础—pandas自带函数map()/apply()/applymap()

在进行数据处理时,经常会对一个DataFrame展开逐行、逐列、逐元素的操作,对应这些操作,常常使用Pandas中的map、apply和applymap三个函数进行处理。本文主要讲这三个函数在series、dataframe数据结构下应用情况及三个函数的区别。

2023-08-31 10:52:52 6463

原创 python利用pandas统计分析—groupby()函数的使用

介绍一下groupby的基本原理、对应的agg、transform和apply操作、groupby后的去重统计及重命名列名。

2023-08-31 10:44:29 9417 2

原创 python替换—Series.replace()与Series.str.replace()的区别及为何replace()无效的解决方法

在Pandas中做数据处理,经常使用.replace()与.str.replace()方法来进行数据替换,本文介绍两种方法适用的对象,其中对于Series数据类型,它是一个由一维数组表示的DataFrame列,而.replace和.str.replace是Series对象的两种方法,虽然它们的名称相似,并且都用于替换Series的值,但实际上它们之间存在不同之外。

2023-08-25 18:19:10 2756

原创 python基础—python6种基本数据类型及数据类型之间转换

python6种基本数据类型(str,int,float,list,dict,set,tuple...)及数据类型相互之间转换

2023-08-24 16:15:49 3994

原创 python数据清洗—利用pandas筛选数据

利用pandas筛选数据

2023-08-22 16:13:20 273

原创 python基础—re模块下的函数及匹配对象的属性与方法(re.match()/re.search()...等)

re模块下的函数及匹配对象的属性与方法—re.match()/re.search()...等

2023-08-22 15:32:35 5126

原创 【hive】WHERE column_name IN (value1,value2,...),value字段是否要加单引号的情况分析

【hive】WHERE column_name IN (value1,value2,...),value字段是否要加单引号的情况分析

2023-05-10 14:39:25 349

原创 【hive】hive数据类型及数据类型转换的注意事项

hive数据类型及数据类型转换的注意事项

2023-05-10 09:04:32 10893

原创 【shell】用date求相对时间的注意事项

【shell】用date求相对时间的注意事项

2023-05-08 10:35:08 140

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除