- 博客(111)
- 收藏
- 关注
原创 【python基础】—python string和bytes类型互相转换(decode()/str()/encode()/bytes())
python string和bytes类型互相转换(decode()/str()/encode()/bytes())
2024-01-31 15:04:58
1810
原创 【python基础】类与类的实例化对象、类方法与类的属性、类实例化的方法与属性、初始化函数、类的继承与重写、@property、私有属性与方法
类与类的实例化对象、类方法与类的属性、类实例化的方法与属性、初始化函数、类的继承与重写、@property、私有属性与方法
2024-01-31 11:29:44
5667
3
原创 【python应用】—利用python构造邮件、解析邮件、发送邮件、接收邮件(email、smtplib、imaplib模块)
利用python构造邮件、解析邮件、发送邮件、接收邮件(email、smtplib、imaplib模块)
2024-01-23 18:05:12
3059
原创 【python报错】Jupyter Notebook读取文件IOPub数据率超出怎么修改`--NotebookApp.iopub_data_rate_limit`
Jupyter Notebook读取文件IOPub数据率超出怎么修改`--NotebookApp.iopub_data_rate_limit`
2024-01-19 11:48:13
780
原创 【python基础】—内置排序函数sort()、sorted()、reversed()
本文主要介绍python内置排序函数sort()/sorted()/reversed()的用法以及sort()与sorted()用法的区别。
2023-11-22 10:19:05
11948
原创 【python基础】random模块常用方法讲解
Python标准库中的random函数,可以生成随机浮点数、整数、字符串,甚至帮助你随机选择列表序列中的一个元素,打乱一组数据等。本文主要讲random模块下面相关函数random();uniform();randint();randrange();choice();shuffle();sample()的用法。
2023-11-22 10:09:17
331
原创 【hive】- 使用insert into/insert overwrite插入数据到静态分区、动态分区、动静态分区
使用insert into/insert overwrite插入数据到静态分区、动态分区、动静态分区
2023-11-15 16:49:41
16943
4
原创 【hive遇到的坑】—使用 is null / is not null 对string类型字段进行null值过滤无效
使用 is null / is not null 对string类型字段进行null值过滤无效
2023-11-15 10:07:37
1124
原创 【python基础】python切片—如何理解[-1:],[:-1],[::-1]的用法
本文主要讲对序列对象的切片索引及如何理解[-1:],[:-1],[::-1]的用法
2023-11-03 17:32:22
8205
2
原创 【python基础】魔法参数*args, **kwargs的使用
本文主要讲魔法参数 *args和 **kwargs 的如何使用,如何将不定数量的参数传递给一个函数和调用一个函数。
2023-11-02 15:19:39
4058
1
原创 【linux基础】— linux下的source filename.sh及与sh filename.sh、./filename.sh命令的区别
linux下的source filename.sh及与sh filename.sh、./filename.sh命令的区别
2023-09-22 17:55:09
285
1
原创 【python数据分析基础】—对列操作:获取DataFrame不同的类型columns
在DataFrame进行数据分析时,我们时常会想对DataFrame的所有列进行数据清洗操作,比如转换不同字段的数据类型,但如果DataFrame字段比较多,一列列数据引用进行数据处理显现效率比较低,使用DataFrame.columns方法获取的结果可以观察到列名和数据类型,但是无法直接对得到的结果进行操作。因此本文主要介绍返回DataFrame的列名的不同类型,我们对此进行操作。
2023-09-21 09:18:08
1490
原创 【python数据分析基础】—对列操作:调整DataFrame的列顺序
在数据处理过程中,经常需要将列按照一定的要求进行排序,以方便展示。本文主要几种调整列顺序的常用方法。
2023-09-21 09:17:10
5280
原创 【python基础】—函数def()的定义与调用、参数、return返回值及变量作用域
【python基础】—函数def()的定义与调用、参数、return返回值及变量作用域
2023-09-19 15:23:27
17597
4
原创 python报错—使用.str.contains()方法替换某一列报错:AttributeError: ‘str‘ object has no attribute ‘str‘及解决方案
python报错—使用.str.contains()方法替换某一列报错:AttributeError: 'str' object has no attribute 'str'及解决方案
2023-09-15 17:02:47
4945
原创 python报错—为什么用apply方法使用.replace()方法报错TypeError: str.replace() takes no keyword arguments
为什么用apply方法使用.replace()方法报错TypeError: str.replace() takes no keyword arguments、.str.replace()方法会报错AttributeError: ‘str’ object has no attribute ‘str’?
2023-09-15 14:59:47
1700
原创 【hive】行转列—explode()/posexplode()/lateral view 函数使用场景
【hive】行转列—explode()/posexplode()/lateral view 函数使用场景
2023-09-13 15:22:30
4254
2
原创 【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景
【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景
2023-09-13 15:22:07
16397
2
原创 【hive】—原有分区表新增加列(alter table xxx add columns (xxx string) cascade;)
原有分区表新增加列(alter table xxx add columns (xxx string) cascade;)
2023-09-11 17:08:01
2883
原创 python可视化模块—快速利用matplot绘制图表
本文主要讲python可视化模块matplotlib的绘图及用matplotlib绘画常用绘图
2023-09-08 17:48:04
2153
原创 【python基础】——Anaconda下包更新的坑及安装与卸载、及安装后Jupyter Notebook没反应的解决方法
本文为个人复盘,关于怎么一步步从最初更新包,走到anaconda安装与卸载、及重新安装后Jupyter Notebook运行不生效的解决方法。
2023-09-08 17:44:30
1276
原创 python数据分析基础—取某个字符的前几个字符
在进行数据分析时,有时候我们需要提取单列的前几个字符串进行分析。本文主要讲述针对这种情况处理方法。
2023-09-05 15:39:53
2439
原创 python数据分析基础—pandas中set_index()、reset_index()的使用
python数据分析基础—pandas中set_index()、reset_index()的使用
2023-09-01 10:18:31
12269
原创 python数据分析基础—Pandas数据类型转换
利用Pandas进行数据清洗,探索时,常常会涉及的数据类型的转换,发现某些特征列不是Pandas所能处理的类型,因此如何将Python基本数据类型转化为Pandas所能处理的数据类型,本文主要介绍三种方法,astype()、自定义函数及to_numeric()转化为Pandas所能处理的数据类型。
2023-08-31 10:58:18
4401
原创 Pandas数据分析基础—pandas自带函数map()/apply()/applymap()
在进行数据处理时,经常会对一个DataFrame展开逐行、逐列、逐元素的操作,对应这些操作,常常使用Pandas中的map、apply和applymap三个函数进行处理。本文主要讲这三个函数在series、dataframe数据结构下应用情况及三个函数的区别。
2023-08-31 10:52:52
6463
原创 python利用pandas统计分析—groupby()函数的使用
介绍一下groupby的基本原理、对应的agg、transform和apply操作、groupby后的去重统计及重命名列名。
2023-08-31 10:44:29
9417
2
原创 python替换—Series.replace()与Series.str.replace()的区别及为何replace()无效的解决方法
在Pandas中做数据处理,经常使用.replace()与.str.replace()方法来进行数据替换,本文介绍两种方法适用的对象,其中对于Series数据类型,它是一个由一维数组表示的DataFrame列,而.replace和.str.replace是Series对象的两种方法,虽然它们的名称相似,并且都用于替换Series的值,但实际上它们之间存在不同之外。
2023-08-25 18:19:10
2756
原创 python基础—python6种基本数据类型及数据类型之间转换
python6种基本数据类型(str,int,float,list,dict,set,tuple...)及数据类型相互之间转换
2023-08-24 16:15:49
3994
原创 python基础—re模块下的函数及匹配对象的属性与方法(re.match()/re.search()...等)
re模块下的函数及匹配对象的属性与方法—re.match()/re.search()...等
2023-08-22 15:32:35
5126
原创 【hive】WHERE column_name IN (value1,value2,...),value字段是否要加单引号的情况分析
【hive】WHERE column_name IN (value1,value2,...),value字段是否要加单引号的情况分析
2023-05-10 14:39:25
349
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅