自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Python pdf与docx格式互转

在日常工作中经常遇到docx文件转换成pdf文件,或者pdf文件转换成docx文件,前者word和wps都可以轻松完成,但是pdf转docx往往不能免费使用,这里可以借助Python轻松实现pdf转docx。注意这里pdf转word是对文字或者图片的识别,故而新的docx文件的格式可能会与原文件有误差。虽然word转pdf可以使用办公软件完成,这里依然分享Python实现word转pdf的代码。

2024-06-09 10:04:43 224 1

原创 熵权法-实际案例

根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,并且信息熵值越小,指标的离散程度(无须程度)越大,该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。通过pandas读取数据,看看原始数据的本来面目,再根据数据的正向性(越大越好)或负向性(越小越好)进行0-1标准化,注意标准化的方法有很多,此处使用的标准化方法并不是唯一的,也不一定是最好的,标准化的方法要根据实际情况选择相对合理的。

2023-12-24 22:21:35 1536 3

原创 Mysql 之求平均次日留存率、用户连续签到(登录)问题(含lag、lend、日期函数用法)

(1)、题目:现在运营想要查看用户在某天刷题后第二天还会再来刷题的平均概率。请你取出相应数据。(2)、数据:其中question_practice_detail是表名,id类似索引无实际意义,device_id是设备id不唯一,quest_id是所做题目的id,result是答题结果,date是日期。(3)、问题分解表里的数据可以看作是全部第一天来刷题了的,那么我们需要构造出第二天来了的字段,因此可以考虑用left join把第二天来了的拼起来,限定第二天来了的可以用。

2023-05-11 09:36:51 1059

原创 层次分析法- 实际案例(南京市土地价值指数评估)

使用层次分析法具体分析南京市2012-2021十年间土地价值指数变化的实战案例

2023-03-28 23:01:10 432

原创 在某单车公司实习时常用的presto、hive函数(残缺,够用)

在某单车公司实习的时候经常用到的hive、presto函数

2022-12-16 17:51:11 1563

原创 分类算法-Logistic Regression(逻辑回归)实战案例

Logistic Regression(逻辑回归)

2022-12-16 14:31:47 3536 2

原创 分类算法-随机森林实战案例

随机森林、调参、特征筛选

2022-12-15 16:10:07 12198 18

原创 灰色关联度

灰色关联度分析理论的应用实例和代码

2022-11-06 21:12:09 2737

原创 相关性分析、相关系数矩阵热力图

相关性分析以及热力图展示。

2022-10-18 11:59:53 24873 3

原创 sklearn库三种标准化与反标准化方法介绍

详细介绍sklearn库三种标准化与反标准化方法

2022-09-15 22:03:31 5863

原创 OS 模块介绍

Python语言里os模块的用法总结

2022-09-03 17:45:12 8130 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除