自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 将pandas读取csv中的NAN变成空字符串

说明 在使用python处理pandas读取出来的数据发现里面存在nan,nan的类型不是str,也不是None,处理有点棘手,所以需要在读取的时候将nan的值去掉 方法 pandas.read_csv('XXX.csv', keep_default_na=False) ...

2019-11-22 14:37:29 7819

原创 Linux读取pdf,pdf转txt

说明 在linux上快速读取pdf,打印pdf内容,将pdf转换为txt 工具:pdftotext 安装 apt install pdftotext 使用 将pdf转成txt pdftotext -enc UTF-8 XXX.pdf XXX.txt 将pdf内容打印出来 pdftotext -enc UTF-8 XXX.pdf - ...

2019-11-22 14:24:56 922

原创 快速读取MS word doc/docx文字 doc2txt docx2txt

此方法适用在追求速度的doc2txt,会丢失格式化信息,复杂doc可能会出错 使用antiword库, linux安装antiword库: apt install antiword 文档转换:antiword xxx.doc > xxx.txt ...

2019-11-22 14:14:22 1017

原创 将txt转换为pdf

安装ghostscript、paps: Ubuntu: sudo apt installghostscript paps Mac: brew installghostscript paps 使用paps将txt文件转为ps文件 paps example.txt > example.ps 再使用ghostscript将ps文件转为pdf文件: ps2pdf example....

2019-11-13 16:00:27 434

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除