自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(291)
  • 收藏
  • 关注

原创 python 操作gsheet 实现读写操作脚本实战

【代码】python 操作gsheet 实现读写操作脚本实战。

2024-07-13 01:32:55 124

原创 连接mysql数据库-plus

【代码】连接mysql数据库-plus。

2024-07-12 16:15:59 66

原创 下午报数PLUS版本-2024-07-12

【代码】下午报数PLUS版本-2024-07-12。

2024-07-12 15:00:26 136

原创 cookies放请求头还是请求体?

【代码】cookies放请求头还是请求体?

2024-04-25 16:43:00 275

原创 json.dumps: dict ——> str

STEP2 : 参数提取,给我全部整成斜杠了,我去。STEP3 : 构建时间变量参数。STEP4 : 正确示范。

2024-04-24 19:28:13 236

原创 红包参与领取、活跃用户等相关9题

(为什么会出现“已领取红包,但未登录的情况”,因为在现实的数据中,数据上报无法做到十分准确,这种其实是BUG数据。备注:日志流水表,每一行为领取1次红包。无特殊说明,一般不考虑领取红包但当日未登录的情况。备注:一个用户1天只出现1次,出现即表示当日登陆。

2024-02-19 17:33:22 401 1

原创 Mysql构造临时维度表

解决方案:构建双维度。

2024-01-29 15:00:11 521

原创 使用Matplotlib绘制双柱状图

【代码】使用Matplotlib绘制双柱状图。

2024-01-24 15:29:22 625

原创 格式化日期表头

原理:函数内部使用datetime.strptime()将日期表头字符串转换为日期对象,然后使用date_obj.strftime()将日期对象格式化为指定格式的字符串。

2024-01-24 14:21:16 350

原创 metabase filter

除“字段过滤器”之外的所有变量类型都会自动导致在此问题上放置过滤器小部件;然后,您可以选择在您的问题上显示过滤器小部件,但即使不这样做,您现在也可以在将此问题添加到仪表板时将字段过滤器变量映射到仪表板过滤器。为变量提供“字段过滤器”类型允许您将问题链接到仪表板过滤器小部件或在 SQL 问题上使用更多类型的过滤器小部件。字段过滤器变量插入的 SQL 类似于在现有列上添加过滤器时由 GUI 查询生成器生成的 SQL。本机查询中的变量允许您使用过滤器小部件或通过 URL 动态替换查询中的值。

2023-12-19 12:29:41 147

原创 对于技术人员实力的判断

俗话说“文无第一,武无第二”,技术就是一种“文”的能力,很多时候我们很难直观看出一个技术人员的实力,但不管是公司招聘的面试,还是公司内部的晋升面评,都需要在较短时间内快速判断一个技术人员的实力。得益于工作岗位的关系,我在考核技术人员的实力时积累了较丰富的经验(包括踩坑的经验)。首先是招聘,前后面试了几百个人吧,技术范围包括服务器、android、iOS、前端,既包括初出茅庐的应届生,也包括腾讯的 T4 大牛;

2023-12-07 17:44:18 126

原创 pymysql.err.InternalError: (1054, “Unknown column ‘nan‘ in ‘field list‘“

记录在本地环境通过,然后在云环境,解决问题的过程;

2023-12-06 19:14:23 458

原创 ProgrammingError: nan can not be used with MySQL

【代码】ProgrammingError: nan can not be used with MySQL。

2023-11-30 16:25:04 896

原创 DataFrame.empty 与 DataFrame is None 的区别是?

总结来说,DataFrame.empty用于检查DataFrame对象是否为空,而DataFrame is None用于检查DataFrame对象是否为None对象。在上述示例中,由于DataFrame对象df被显式设置为None,因此df is None为True,输出结果为"DataFrame为None"。在上述示例中,由于DataFrame对象df不包含任何数据,因此df.empty为True,输出结果为"DataFrame为空"。请注意,empty 与 None 是不同的概念,这个要注意。

2023-11-17 11:05:40 408

原创 傻傻分不清 “json.dump()、 json.dumps()、 json.loads() 、 json.load()“的区别?

json.dump():将Python对象序列化为JSON格式的数据并将其写入文件。它接受两个参数:要序列化的Python对象和要写入的文件对象。示例用法:json.dump(obj, file)。json.dumps():将Python对象序列化为JSON格式的字符串。它接受一个参数:要序列化的Python对象。示例用法:json.dumps(obj)。json.load():从文件中读取JSON格式的数据并将其反序列化为Python对象。它接受一个参数:要读取的文件对象。

2023-11-09 15:19:23 381

原创 【常用总结】用Python对数据结构进行个性化过滤操作

【代码】【常用总结】用Python对数据结构进行个性化过滤操作。

2023-11-08 15:28:42 136

原创 【重磅】Cookies、headers、Session规律总结,搞定卡点

【重磅】Cookies规律总结,搞定卡点。放在请求头headers中。

2023-11-04 22:43:39 661

原创 【实用】得到三个动态时间点作为分界点

因为周报需要对比上周,所以现在有一个需求,动态生成上周周一的时间点,类似 ‘2023-10-23 00:00:00’ 并将值赋予给time2变量,将time2 减去7天,得到的时间点赋值给time1,将time2 减去7天,得到的时间点赋值给time3,得到三个动态时间点作为分界点;

2023-11-03 15:53:13 75

原创 ConnectionError: HTTPSConnectionPool

连接不上url ,chatcpt 第一步就告诉我了,折腾了大半个下午,惭愧!

2023-11-02 18:24:25 1162

原创 Xpath定位元素(3)

【代码】Xpath定位元素(3)

2023-11-01 18:24:50 73

原创 通过Xpath解析尝试多种方法提取文本

【代码】通过Xpath解析尝试多种方法提取文本。

2023-11-01 17:38:51 1518

原创 Xpath解析小案例

【代码】Xpath解析小案例。

2023-11-01 17:00:33 74

原创 Xpath解析实战

【代码】Xpath解析实战。

2023-11-01 16:47:45 40

原创 教你用BeautifulSoup实现数据解析,并爬取豆瓣TOP250电影榜

这三个库的详细用法,请看我的其他视频课程。

2023-10-31 11:39:14 364

原创 索引切片复习

【代码】索引切片复习。

2023-10-31 11:14:08 66

原创 手机型号抓取

方式②:原始数据中,每个页面的数据存储在一个列表中,然后页面中的每条数据以字典单元形式盛放在列表中,因此,策略是可以先通过aList.extend(bList)方法,把所有的需要的n个页面中的列表中的字典(每条记录)总体组装在一个总列表中 --》 然后再转成一个总的df。方式①:每个页面的数据处理成df, 然后再合并df , pd.concat()/ df.append() 循环合并。Code处理结果:DataFrame 及 流程。个人感觉方式②的效果会更高效一些!

2023-10-31 09:56:41 75

原创 使用Python计算数据集中不同维度下的方差和 JS 散度

本文介绍了如何使用 Python 和 Pandas 库计算数据集中不同维度下的方差和 JS 散度。这些指标可以用于评估各维度变化的波动大小,从而实现异常维度挖掘和数据分析等目的。在数据挖掘领域中,我们经常需要衡量不同维度之间的差异或相似度。为了实现这一目标,通常需要使用各种方法来计算两个样本之间的差异。本文将介绍如何使用 Python 和 Pandas 库来计算数据集中不同维度下的方差和 JS 散度,以评估各维度变化的波动大小。最后,我们得到了各维度下的方差和 JS 散度指标。

2023-05-30 19:01:15 768

原创 Python 连接 MySQL 数据库

首先,在使用 pandas.read_sql() 时,需要在 SQL 查询语句中包含所有必要的过滤条件、排序方式等信息,以确保返回的结果集合是正确的,而不是整个表或视图中的所有数据。除了使用 pymysql 库连接 MySQL 数据库之外,我们还可以使用 SQLAlchemy 的 create_engine 函数创建 MySQL 数据库连接引擎,并使用 Pandas 库中的 read_sql 函数直接将查询结果转化为 Pandas dataframe 对象。希望本文对您有所帮助!

2023-05-17 20:09:30 18264 5

原创 Python数据离散化指南:手写if-elif语句与pandas中cut()方法的实现

第二种方法是使用 pandas 库的 cut() 方法将输入值 x 映射到不同的标签中,并返回标签。两种方法各有优缺点。第一种方法是使用条件语句来显式地检查输入值 x 是否在每个区间内,并返回相应的标签。这种方法适用于自定义的分段方式,要求手动设置每个阈值和对应的标签。当我们进行数据分析时,有时候需要对数值型数据进行离散化,将其划分为不同的标签或类别。其中 tran_amount_label 是新添加的一列,它显示了每个交易额所属的标签和类别。在本文中,我们将介绍两种常见的离散化方法,并提供实现代码。

2023-05-16 18:36:10 504

原创 cursor.execute 执行两个结果并存储给变量

cursor.execute 执行两个结果并存储给变量

2023-04-06 14:28:58 810

原创 replace into 、INSERT IGNORE INTO

【代码】replace into 、INSERT IGNORE INTO。

2023-03-28 17:22:10 82

原创 metabase的地图展示方式及切换地图源

瓦片数据也是可以修改,如使用https://blog.csdn.net/banhusao3974/article/details/102053671。1、pin map,就是按经纬度在地图上打点,要求数据必须有经纬度:Latitude field及Longitude field。2、region map ,这个比较简单,按区域显示数据,有对应区域编号,比如city就可以,注意是编号要在地域数据中有。3、grid map,这个只按区域(瓦片,tile)显示汇总只,必须配置对应的汇总函数。

2023-03-22 15:22:32 450

原创 ‘python换行符

【代码】‘python换行符。

2023-03-05 15:46:25 109

原创 大数据常见术语

大数据常见术语一览主要内容包含以下(收藏,转发给你身边的朋友)雪花模型、星型模型和星座模型事实表维度表上钻与下钻维度退化数据湖UV与PV画像ETL机器学习大数据杀熟SKU与SPU即席查询数据湖数据中台ODS,DWD,DWS,DWT与ADST0与T+1用户画像用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际

2023-03-01 10:37:03 3727

原创 数据库必知词汇:即席查询(Ad Hoc)

它们之间的差别在于,通常的查询在系统设计和实施时是已知的,所有我们可以在系统实施时通过建立索引、分区等技术来优化这些查询,使这些查询的效率很高。而即席查询是用户在使用时临时生产的,是一种松散类型的命令/查询,其值取决于某个变量,每次执行命令时,结果都不同,这取决于变量的值。临时查询是短期的,并且是在运行时创建的。在一个数据仓库系统中,即席查询使用的越多,对数据仓库的要求就越高,对数据模型的对称性的要求也越高。即席查询与普通应用查询最大的不同是普通的应用查询是定制开发的,而即席查询是由用户自定义查询条件的。

2023-03-01 10:32:09 703

原创 我用python封装了个实现对MySQL建库、建表并实现增删改查操作的类

我用python封装了个实现对MySQL建库、建表并实现增删改查操作的类。

2023-02-25 21:45:18 183

原创 这个探索案例,让我彻底把cursor、commit的问题搞清楚了

【代码】这个探索案例,让我彻底把cursor、commit的问题搞清楚了。

2023-02-25 21:39:57 599

原创 分享一个通过python执行sql语句的模板

【代码】分享一个通过python执行sql语句的模板。

2023-02-25 21:24:30 273

原创 使用字符型变量的经典场景

case1:

2023-02-25 20:50:17 73

原创 使用 time 模块的 strftime 方法来格式化日期

【代码】使用 time 模块的 strftime 方法来格式化日期。

2023-02-25 18:12:43 360

5分钟使用Python爬取豆瓣TOP250电影榜

使用requests爬取网页 使用BeautifulSoup实现数据解析 借助pandas将数据写出到Excel

2023-10-31

PART5 机器学习分类算法之决策树.ipynb

PART5 机器学习分类算法之决策树.ipynb

2022-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除