自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 python常用画图(分段折线图、多变量柱状图、扇形图、堆积折线图、百分比堆积柱状图)工具代码汇总

本文对使用python绘制各类图形做一个总结,我将附上代码以及图片效果,以方便大家使用python画图。

2022-01-17 14:37:39 9659 1

原创 jar打包过程中manifest文件写错导致NoClassDefFoundError的解决方法

文章的背景是,如果可以做一个参考之前在Java程序导出jar包的过程中,遇到了manifest文件总是写不对的问题。众所周知,manifest 编写格式及其琐碎,什么一行不能超过72个字符,冒号后面一定要有空格,最后一行一定要回车。一个细节没做好,导出的jar包就没法读到引用的jar包。我之前修改了manifest文件30多次,还是出现java.lang.NoClassDefFoundErro...

2020-04-06 17:32:35 668

转载 ThreadPoolExecutor线程池

初识Python中已经有了threading模块,为什么还需要线程池呢,线程池又是什么东西呢?在介绍线程同步的信号量机制的时候,举得例子是爬虫的例子,需要控制同时爬取的线程数,例子中创建了20个线程,而同时只允许3个线程在运行,但是20个线程都需要创建和销毁,线程的创建是需要消耗系统资源的,有没有更好的方案呢?其实只需要三个线程就行了,每个线程各分配一个任务,剩下的任务排队等待,当某个线程完成...

2019-03-19 10:58:42 724

原创 pandas多列数据合并的列名处理方法

有时候我们需要将时间序列上多个时间点的数据列按顺序合并到一个dataframe中,我们会使用data = pd.merge(data, data_later, how='left', on=['code'])这样的代码将数据进行合并之前再加上一个for循环就可以合并许多天的数据了,但是合并之后会出现这样的问题列标题是factor_x,factor_y这样的形式,列数少的话我们...

2018-08-28 15:45:23 10661 2

原创 Pandas dataframe数据处理方法速度比较

数据修改主要以增删改差为主,这里比较几种写法在数据处理时间上的巨大差别。数据量大概是500万行级别的数据,文件大小为100M。1.ilociloc是一种速度极其慢的写法。这里我们对每个csv文件中的每一行循环再用iloc处理,示例代码如下:for index in range(len(df)): df.iloc['attr'][index] = xxx使用这种方法...

2018-08-14 17:05:16 17036 5

原创 小范围排序

这是我的第一篇技术博客,从一个小算法题写起。小范围排序:已知一个几乎有序的数组,几乎有序指的是如果把数组排好序,每个元素移动距离不超过k,且k相对于原数组大小来说很小。比如一个数组[3,1,2,5,6,4,8,7,9]大小为9,我们可以发现每个元素移动不需要超过k=3就可以完成从小到大的排序,我们要选择一个合适的排序算法来对数据进行排序。考虑时间复杂度,我们使用改进后的堆排序,即有一组数组

2017-01-30 13:38:04 246

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除