![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
字符串处理
文章平均质量分 92
马克布克打字机
这个作者很懒,什么都没留下…
展开
-
通过easyexcel将文本文件转为excel xlsx文件
通过easyexcel将csv文本文件转换为excel xlsx的jar包小工具。csv是逗号分隔符,该小工具也支持其他分隔符如竖线(|)、井号(#)或其他自定义的字符串。csv只是文本文件后缀名,也可以是txt或其他后缀名的文本文件。编译环境jdk1.8cmd、linux下可运行自动转换同jar包路径下的所有自动trim(去除单元格里内容的前后空格)字符集UTF8。原创 2022-02-21 18:08:44 · 2594 阅读 · 0 评论 -
c# XElement解析xml文件
先说下背景:统一采集平台每天会从网管采集各种配置文件、网络数据等信息,并以xml文件形式保存在ftp下。再说下工作安排:领导想将每天的采集到的网络拓扑连接信息(即网元A的某端口,有一条连纤,连接至网元B的某端口)保存在数据库里,即解析xml文件并导入数据库。 每天采集到的网络拓扑连接信息xml文件,即TopologicalLink.xml,里边大概长这样:<DATA> ...原创 2018-04-15 00:42:22 · 12037 阅读 · 0 评论 -
C# 递归解析xml文件
第一次写解析xml文件算是顺利搞定,没想到后来陆续提出了更多的需求,主要是遇到以下几个问题:load整个文件。代码专用了。存在多个同名元素。 对于问题1,load整个文件这个问题。既然不能将上G的文件一次性load进内存,那就改用流读取(stream)的形式。在网上找到一个不错的读取函数,IEnumerable<XElement> StreamXElem...原创 2018-04-15 10:56:44 · 1636 阅读 · 0 评论 -
python 图片中的表格识别
表格图片的内容识别接到个任务需要将几万张带表格的图片转换成结构化数据。1. 大步骤最终算是完成任务,但是识别率上还有一点问题,人工再过一下,还是蛮快的。先说一下大的步骤: 1. 分割单元格。将图片中的表格全部定位出来,然后按单元格裁剪成一个个小图片,以便后续分析及操作; 2. 聚焦。其实就是将单元格中的文本区域裁剪出来,将多余的空白去掉; 3. 大图片的识别。对于大图片用图像...原创 2018-07-09 14:15:35 · 50376 阅读 · 42 评论