- 博客(11)
- 收藏
- 关注
原创 Python pdf与docx格式互转
在日常工作中经常遇到docx文件转换成pdf文件,或者pdf文件转换成docx文件,前者word和wps都可以轻松完成,但是pdf转docx往往不能免费使用,这里可以借助Python轻松实现pdf转docx。注意这里pdf转word是对文字或者图片的识别,故而新的docx文件的格式可能会与原文件有误差。虽然word转pdf可以使用办公软件完成,这里依然分享Python实现word转pdf的代码。
2024-06-09 10:04:43 269 1
原创 熵权法-实际案例
根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,并且信息熵值越小,指标的离散程度(无须程度)越大,该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。通过pandas读取数据,看看原始数据的本来面目,再根据数据的正向性(越大越好)或负向性(越小越好)进行0-1标准化,注意标准化的方法有很多,此处使用的标准化方法并不是唯一的,也不一定是最好的,标准化的方法要根据实际情况选择相对合理的。
2023-12-24 22:21:35 1746 3
原创 Mysql 之求平均次日留存率、用户连续签到(登录)问题(含lag、lend、日期函数用法)
(1)、题目:现在运营想要查看用户在某天刷题后第二天还会再来刷题的平均概率。请你取出相应数据。(2)、数据:其中question_practice_detail是表名,id类似索引无实际意义,device_id是设备id不唯一,quest_id是所做题目的id,result是答题结果,date是日期。(3)、问题分解表里的数据可以看作是全部第一天来刷题了的,那么我们需要构造出第二天来了的字段,因此可以考虑用left join把第二天来了的拼起来,限定第二天来了的可以用。
2023-05-11 09:36:51 1141
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人