Python
lanyuelvyun
互金公司风控算法工程师
展开
-
pandas 小技巧——如何显示程序进度/进度条的使用/tqdm的使用
python的进度条库:tqdm原创 2022-09-02 13:52:13 · 2391 阅读 · 1 评论 -
jupyterLab 如何修改字体大小
1、打开jupyterLab,左键单击【Settings】,选择【Advanced Settings Editor】2、在上一步弹出来的页面中,左键单击【Notebook】,然后在右侧的【User Overrides】中进行增删改,这个地方就是自定义字体设置的地方。参考代码如下:{ // Notebook // @jupyterlab/notebook-extension:tracker // Notebook settings. // **************原创 2022-03-02 10:58:24 · 14599 阅读 · 0 评论 -
pandas 小技巧——pd.concat(dict)
pandas.concat()pandas.concat(),一般最常见的用法如下:传入的参数是一个list,里面是dfdf_new = pd.concat([df1, df2])其实,它还有一个更好用的用法:传入的参数是字典,其中字典的value是一个Series,其key值是该Series的名称/标识。如下df_new = pd.concat(series_dict).reset_index()这个用法在我们进行数据分析的时候,会经常用到。比如:给定一个样本集S,每个样本包含N个特征,任务原创 2021-12-08 11:56:51 · 3215 阅读 · 0 评论 -
python 插值 —— 如何实现插值,以及错误ValueError: A value in x_new is below the interpolation range.
插值插值,是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值。–摘自百度百科插值与拟合有一定差别,但其目的都是类似的,根据已有数值,生成预测函数,来预测目标值。下面介绍一下,在Python中如何实现插值。import scipy.interpolate as spi# 准备数据,X和Y都是有限离散点集,X与Y是一一对应的# 我们想用X逼近YX Y # 准备插值点,就是拟合点,用于生成插值函数# 1)如果(X, Y)有很多,就从X和Y中原创 2021-10-26 15:57:53 · 9569 阅读 · 5 评论 -
pandas 小技巧——df如何筛选包含特定字符的列(或者行)
dataFrame如何筛选包含指定字符的列[x for x in df.columns if '指定字符' in x]dataFrame如何筛选包含指定字符的行df[df['列名'].str.contains('指定字符')]原创 2021-10-11 15:48:57 · 12392 阅读 · 0 评论 -
pandas 小技巧——如何生成pmml模型文件
# 生成pmmlfrom lightgbm.sklearn import LGBMClassifierfrom sklearn2pmml import sklearn2pmmlfrom sklearn2pmml.pipeline import PMMLPipeline# 首先,使用某一种算法训练完成得到一个模型main_model = LGBMClassifier()# 将训练好的model包装成pmml格式pipeline = PMMLPipeline([("classifier", ma原创 2021-05-11 14:38:33 · 851 阅读 · 2 评论 -
pandas 小技巧——如何删除行或者列、根据条件删除指定行或者列
使用df.dropDataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors=‘raise’)1、labels:要删除的标签,一个或者多个(以list形式);2、axis:指定哪一个轴,=0删除行,=1删除列;3、columns:指定某一列或者多列(以list形式);4、level:索引等级,针对多重索引的情况;5、inplaces:是否替换原来的datafram原创 2021-05-10 20:22:24 · 52012 阅读 · 1 评论 -
pandas 小技巧——如何将多个df保存在一个Excel的不同sheet里
如何将多个df保存在一个Excel的不同sheet里原创 2020-11-26 16:22:00 · 2101 阅读 · 0 评论 -
python2.7 小知识——操作中文名文件乱码等编码问题
python2.7 小知识——操作中文名文件乱码等编码问题原创 2019-07-08 17:07:44 · 2846 阅读 · 0 评论 -
python 小知识——strftime()和strptime() 日期获取、格式转换和计算
python 小知识——strftime()和strptime() 日期获取、格式转换和计算原创 2019-07-05 12:16:18 · 9390 阅读 · 0 评论 -
pyspark 小知识——自定义聚合函数UDAF:使用pyspark分组计算AUC
在pyspark中,自定义聚合函数UDAF,在实现上有些困难,但是我们可以用另外一种方法实现同样的功能:利用自定义函数UDF,实现自定义聚合函数UDAF的功能。原创 2020-10-23 16:23:43 · 5728 阅读 · 5 评论 -
python opencv minAreaRect 生成最小外接矩形
1、方法:使用python opencv返回点集cnt的最小外接矩形,所用函数为 cv2.minAreaRect(cnt) ,cnt是点集数组或向量(里面存放的是点的坐标),并且这个点集中的元素不定个数。2、举例说明:画一个任意四边形(任意多边形都可以)的最小外接矩形,那么点集cnt 存放的就是该四边形的4个顶点坐标(点集里面有4个点)cnt = np.array([[x1,y...原创 2017-08-03 11:05:33 · 135603 阅读 · 22 评论 -
pandas 小技巧——set_index()和reset_index()
set_index()和reset_index()的使用介绍原创 2019-07-05 11:27:57 · 5675 阅读 · 0 评论 -
pandas 小技巧——使用时候的“坑”
1、使用字典创建df的时候,如果字典的key只有一个value会报错2、python中字符串的最后一个字符是斜杠会导致出错3、空值判断原创 2019-07-02 11:14:01 · 374 阅读 · 0 评论 -
pandas 小技巧——修改Series的index名称
1、修改series的index名称2、合并两个series,并对列名进行重命名原创 2019-10-23 19:46:13 · 11367 阅读 · 0 评论 -
pandas 小技巧——空值判断:对整个Series/Dataframe判断+对单独值判断
空值判断:对整个Series/Dataframe判断+对单独值判断原创 2019-10-23 19:44:20 · 18527 阅读 · 1 评论