工具类
向阳争渡
这个作者很懒,什么都没留下…
展开
-
Java 读取CSV文件
Java读取CSV文件原创 2017-12-26 16:09:55 · 1067 阅读 · 0 评论 -
python 小知识集锦
list中extend和append的区别:1. append() 方法向列表的尾部添加一个新的元素。只接受一个参数。2. extend()方法只接受一个列表作为参数,并将该参数的每个元素都添加到原有的列表中。Zip()和Zip(*a)的区别:可以看成是解压和压缩的区别,zip相当与压缩 zip(*)相当于解压。a= [1,2,3,4]b = [5,6,7]c = li...原创 2019-04-18 13:45:47 · 186 阅读 · 0 评论 -
python3 读取docx 并剔除中文全角符号
import docximport refrom docx import Documentimport stringpath = '/Users/ya/Desktop/11246441.docx'document = Document(path)for line in document.paragraphs: line = line.text.strip().split()...原创 2019-04-17 22:45:04 · 949 阅读 · 0 评论 -
pandas 操作小技巧汇编
不定时更新工作中遇到的小trickDataFrame.tocsv() 输出的colume最前面多了一个逗号解决办法:设置index=False即可train_data[['qid','title_char']].to_csv('/root/workspace/my_zhihu/data/train_title_char.csv',index=False)按某个列的colume...原创 2019-04-12 17:29:55 · 160 阅读 · 0 评论 -
Mac使用vim删除文件中的^M换行符
在Linux下打开Windows编辑过的文本,会出现由于换行符不一致而导致的内容错乱的问题,最常见的是^M。可在vim中用命令行替换删除vim切换命令模式::%s/^M//g #注意这里的~M用Ctrl+V Ctrl+M生成,而不是输入的...原创 2018-12-12 14:20:08 · 1154 阅读 · 1 评论 -
java 读取PDF目录、对应页码
package com.ca.spark;import java.io.IOException;import java.util.HashMap;import java.util.Iterator;import com.itextpdf.text.pdf.PdfReader;import com.itextpdf.text.pdf.SimpleBookmark;public cl...原创 2018-12-05 14:03:48 · 5909 阅读 · 9 评论 -
偷懒系列
JDK<build> <plugins> <plugin> <artifactId> maven-assembly-plugin </artifactId> <configuration> ...原创 2018-07-25 10:26:59 · 149 阅读 · 0 评论 -
Java写入txt文件内容
Java 追加写入TXT原创 2017-12-29 14:55:00 · 31133 阅读 · 2 评论 -
java 递归读取文件夹及文件(zip)
java 递归读取文件夹及文件(zip)原创 2017-12-29 12:37:03 · 2647 阅读 · 1 评论 -
java 直接读取zip文件和文件内容
不解压zip文件,直接读取zip包内的文件夹以及文件内容原创 2017-12-29 10:06:00 · 30261 阅读 · 3 评论 -
java 从zip包中抽取文件
java 解析zip中的json串原创 2018-01-04 11:14:42 · 3628 阅读 · 2 评论 -
Java String 解析
Java String 解析转载 2017-12-28 10:51:03 · 268 阅读 · 0 评论 -
java读写excel
之前写过spark读取excel的博客,必须要转csv,但是用java直接处理csv(涉及按“,”分割字符串,字符串中也有“,”),这种情况就很麻烦了,还不具有通用性,故重新采用jxl来处理excel.dependencies> dependency> groupId>net.sourceforge.jexcelapigroupId>原创 2018-01-11 18:16:47 · 137 阅读 · 0 评论