Python
文章平均质量分 64
烟雨人长安
空气,水,食物,书是生命中必不可少的四项事物!
展开
-
PySpark sql 中一些函数的总结(持续更新)
spark sql 常见的函数原创 2023-01-29 17:27:07 · 1153 阅读 · 1 评论 -
MAC系统 LightGBM模型转为pmml格式
MAC系统 LightGBM模型转为pmml格式 相关流程原创 2023-01-28 16:46:52 · 983 阅读 · 0 评论 -
Pandas中 的 rank() 函数 和 groupby 的 rank() 函数用法
一、pandas中的rank()函数首先随机初始化一组数,然后data = pd.Series([1,2,3,4,5])print(data)data = data.rank()print(data)这里的rank()函数打印出来虽然和原数组没区别,但是这里rank表示的是次序,所以这里的1.0,2.0表示的是第一名和第二名如果有重复值的话data = pd.Series([1,1,2,2,3,3,4,4,5])print(data)data = data.rank()原创 2022-02-28 23:42:55 · 10395 阅读 · 0 评论 -
总结一下利用pandas进行条件筛选的几个方法
首先创建一个表:df = pd.DataFrame({'A':[100, 100, 200, 300, 400], 'B':['a', 'a', 'c', 'd', 'e'], 'C':[3, 2, 1, 5, 4]})生成出来的表如下所示:1)找出df中A列值为100的所有数据df[df.A==100]这里也可以是小于(<)、大于(>)、小于等于(<=)、大于等于(>..原创 2021-09-18 15:07:37 · 23107 阅读 · 0 评论 -
Pytorch训练模型得到输出后计算F1-Score 和AUC
1、计算F1-Score对于二分类来说,假设batch size 大小为64的话,那么模型一个batch的输出应该是torch.size([64,2]),所以首先做的是得到这个二维矩阵的每一行的最大索引值,然后添加到一个列表中,同时把标签也添加到一个列表中,最后使用sklearn中计算F1的工具包进行计算,代码如下import numpy as npimport sklearn.metrics import f1_scoreprob_all = []lable_all = []for i,原创 2021-04-24 19:21:58 · 16428 阅读 · 4 评论 -
Python实现笛卡尔乘积的几种方法
引言:面试的时候面试官出的这道题,当时写的不是太好,面试结束后下来查了一下,发现大部分的博客都是使用工具包来实现,而且大部分的博客内容还都完全一样,连数字都没有变,找了半天也没找到几个有用的博客。其实这也是现在大部分博客的风气,互相抄袭,没有一点自己的思考内容,我都不明白写这样的博客有什么意义。所以自己打算实现一个不使用工具包来解决的方法,于是在别人的博客帮助下,实现了用回溯法来解决笛卡尔乘积,下面是总结一下解决这个问题的几个方法:1、工具包from itertools import produc原创 2020-11-17 16:05:49 · 9066 阅读 · 0 评论 -
动态规划模板——Python版本
此文是来自https://leetcode.com/discuss/general-discussion/458695/Dynamic-Programming-Patterns这位外国网友,本人负责汉化目录一、达到目标的最小(最大)路径型问题二、不同的方式三、合并区间四、字符串DP问题四、做决策问题一、达到目标的最小(最大)路径型问题此类问题的描述为:给定目标,找到达到目标的最小(最大)成本(cost)/路径(path)/总和 (sum)。通用模板代码为:for..原创 2020-11-09 20:22:02 · 901 阅读 · 0 评论 -
关于回溯的常见题目
这里的回溯直接用的labuladong的算法框架,回溯解释1、全排列class Solution: def permute(self, nums: List[int]) -> List[List[int]]: def dfs(nums,temp): if len(temp) == len(nums): res.append(temp[:]) for i in range(len(num原创 2020-09-20 12:03:35 · 185 阅读 · 0 评论 -
Python实现矩阵转置的三种方法,不使用API和numpy
如果矩阵为:matrix = [[1,2,3], [4,5,6], [7,8,9] ]第一种方法,不使用额外的数组空间:for i in range(len(matrix)): for j in range(0, i): matrix[i][j],matrix[j][i] = matrix[j][i],matrix[i][j]第二种,使用额外...原创 2020-04-25 22:07:16 · 1110 阅读 · 0 评论 -
python 中 global 和 nonlocal 详细用法解释
一、global1、global 关键字用来在函数或其他局部作用域中使用全局变量。但是如果不修改全局变量也可以不使用 global 关键字。gcount = 0def global_test(): gcount+=1 print (gcount)global_test()以上代码会报错:第一行定义了全局变量,在内部函数中又对外部函数进行了引用并修改,那么 pyt...原创 2020-04-25 21:31:14 · 461 阅读 · 0 评论 -
Pandas 对Excel的同一个sheet表多次写入,不覆盖数据。
在我的这篇博客里https://blog.csdn.net/Matrix_cc/article/details/105025330讲述了pandas处理Excel的一些基本的读写操作。今天来个稍微高级点。向Excel的同一个sheet表里写入的话,pandas没有现成的API使我们调用,所以需要我们自己定义一个函数:import pandas as pdfrom openpyx...原创 2020-03-26 16:49:51 · 7105 阅读 · 0 评论 -
详细教学 Pandas 对excel 文件读写的基本操作!
目录1.读取excel文件2.写入excel文件假如有个excel表的数据如下:1.读取excel文件先导包import pandas as pd读取文件 , shee_name是指定表单fr = pd.read_excel('data.xlsx',sheet_name='people')data=df.head()#默认读取前5行的数据d...原创 2020-03-22 15:15:00 · 3297 阅读 · 0 评论 -
Python判断两个数中最大值的几种方法,可以去跟小伙伴炫(zhuang)耀(bi)了!
1.最普通的一种,这种方法相信小伙伴都能看懂a,b = 1,2if a > b: c = aelse: c = b 2.稍微提升点档次,a,b = 1,2c = a if a>b else b这个是将ifelse写在一行,其实也没什么惊奇的3.有点意思的来了a,b = 3,4c = (a>b and a o...原创 2020-03-12 18:10:48 · 15355 阅读 · 1 评论