
文本文件
一些常用的文本或文件处理技术, 以及格式化。
纯洁的小魔鬼
只有风暴才能击倒大树
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python对文本文件的操作
本文介绍了Python2和Python3中常用的文件操作方法。Python2部分包括:字符串写入文件、追加写入文件、清空文件内容、删除文件末尾字符、指定编码格式读写文件等操作。Python3部分在Python2基础上新增了按行读取文本文件、直接读取文件内容和字符串写入文件等功能,并统一使用encoding参数处理编码问题。两种版本都提供了文件打开、写入、关闭的基本流程,但Python3在编码处理上更加规范简洁。这些方法涵盖了文件操作的基本需求,包括读写、追加、清空等常见场景。原创 2019-05-05 14:24:39 · 2519 阅读 · 1 评论 -
Python文件格式转换
本文介绍了五种数据格式转换方法:1)将带有点坐标的CSV转为GeoJSON(含基本版和带属性版);2)GeoJSON转GeoJSON并添加随机数属性;3)CSV转JSON;4)JSON转GeoJSON(含整体转换和逐行转换);5)文本处理(包括CSV换行符处理和TXT转义符去除)。这些方法使用Python标准库(csv、json)实现,涉及常见地理数据格式间的互转和文本清洗操作,适用于地理信息系统的数据处理需求。原创 2019-09-27 00:01:50 · 3295 阅读 · 0 评论 -
python对csv文件的操作
本文介绍了使用Python处理CSV文件的两种方法:pandas模块和csv模块。pandas部分详细展示了12种读取CSV的技巧,包括基本信息查看、数据展示、行列控制、类型指定、数据遍历和统计等;同时介绍了4种写入CSV的方法,包括覆盖写入、追加写入以及将列表数据写入CSV。csv模块部分则演示了基本的按行读写操作。全文提供了完整的代码示例,涵盖了CSV文件处理的常见需求,适合需要处理表格数据的Python开发者参考使用。原创 2019-01-14 13:04:08 · 5319 阅读 · 0 评论 -
Python中json模块的使用
本文介绍了Python中JSON数据序列化和反序列化的常用方法。在Python2中,使用json.dumps()将字典转为字符串,json.dump()写入文件;反序列化使用json.loads()和json.load()。Python3增加了ensure_ascii=False参数解决中文乱码问题,并支持编码参数设置。两种版本都支持格式化输出,通过indent和separators参数控制缩进和分隔符格式。原创 2018-12-13 01:06:16 · 3124 阅读 · 0 评论 -
python 读取csv或excel自动建表倒数据
本文提供了两个Python脚本,分别实现从CSV和Excel文件自动创建MySQL表并导入数据的功能。两个脚本均使用pymysql连接数据库,自动将文件内容转换为数据库表结构,其中表名取自文件名,字段名取自文件首行,默认所有字段为varchar(255)类型。脚本支持批量插入(每1000条提交一次),并对特殊字符和日期类型进行了处理。Excel版本还额外处理了日期格式转换(xldate_as_tuple)和布尔值转换。使用时只需修改文件路径和数据库连接参数即可实现数据导入。原创 2019-11-24 22:30:58 · 2837 阅读 · 1 评论 -
python 扫描版PDF转文字Word
本文介绍了三种将PDF转换为可编辑文档的方法:1)使用百度API将扫描版PDF转为可复制的文字版PDF,包括安装Python模块、配置API密钥、分页转换图片并识别文字等步骤;2)将扫描版PDF转为Word文档,需额外安装python-docx模块;3)使用pdfminer3k直接提取PDF文字生成Word文档。三种方法均提供完整Python代码实现,涉及PDF分页处理、OCR识别、文档合并等关键技术,适用于不同场景下的PDF转换需求。原创 2019-08-28 00:24:06 · 10368 阅读 · 5 评论 -
Fastjson常用方法
本文介绍了使用Fastjson库进行JSON序列化和反序列化的方法。在序列化方面,演示了如何将Java对象转为JSON字符串(包括格式化输出、处理null字段和类型信息);在反序列化方面,展示了将JSON字符串转为JSONObject、Map、实体类和List的实现方式。通过代码示例详细说明了各种转换场景下的处理技巧,并对比了不同方法的优缺点,如类型转换精度问题和嵌套类型的处理限制。这些方法为Java开发中处理JSON数据提供了实用的参考方案。原创 2018-07-18 14:55:34 · 2165 阅读 · 0 评论 -
Gson常用方法
摘要:本文介绍了Gson库的基本使用方法,重点展示fromJson()和toJson()方法的强大功能。通过代码示例演示了:1)字符串与基本类型(int/double/boolean)的转换;2)JSON字符串与Map/List/实体类的相互转换;3)序列化时如何处理null值。Gson能自动处理嵌套数据结构,将JSON字符串转换为多层级的Map和List结构,同时也支持自定义实体类的序列化与反序列化。原创 2019-02-25 17:02:51 · 2840 阅读 · 0 评论 -
String.format()的使用
本文介绍了Java中String.format()方法的格式化功能,主要包含:1)基本字符串格式化,使用%s占位符;2)字符串宽度和对齐控制,如%10s;3)整数格式化,支持逗号分隔(%d)和负数括号显示(,);4)浮点数格式化,可控制小数位数(.5f)和补零(0100.5f);5)日期时间格式化,使用%tF、%tT等格式符;6)特殊用法%<可以复用前一个参数。每种格式都通过示例说明参数含义,包括占位符、对齐方式、类型转换等语法规则。原创 2018-07-20 18:41:50 · 15464 阅读 · 3 评论 -
java文件操作
本文介绍了Java中常用的文件操作技术,包括:1)文件读写方法(带转义符和不带转义符的写入、多种读取方式);2)文件下载功能(直接下载和从Linux服务器下载);3)SpringBoot获取resources目录下文件的两种方式(文件和流形式);4)ZIP文件解压工具类实现。这些方法涵盖了文件处理的基本场景,包括文件I/O、特殊字符处理、流转换、CSV导出和压缩文件解压等常见需求,并提供了完整的代码示例。原创 2019-02-20 12:45:32 · 532 阅读 · 0 评论 -
shape 文件操作
本文介绍了GIS数据格式转换的Java实现方法,主要包括:(1)Shapefile文件结构解析,包含.shp、.shx、.dbf等必需/可选文件;(2)Shapefile转GeoJSON的实现,使用GeoTools库处理几何数据和属性表;(3)Shapefile转CSV的转换方法,提取空间坐标和属性字段;(4)GeoJSON转Shapefile的逆向转换过程,支持点、线、面等几何类型。所有转换方法均提供完整的Java代码示例和Maven依赖配置,涉及字符编码处理、几何类型判断等关键技术点,适用于GIS数据格原创 2019-10-13 21:46:24 · 5634 阅读 · 1 评论 -
上传文件时服务器路径问题
Java文件上传路径问题主要涉及本地和服务器路径获取。本地路径获取方式包括:1)通过ClassLoader获取项目目录下的绝对路径;2)使用System.getProperty("user.dir")获取工程根目录(仅适用于非Web项目)。服务器路径则可通过ServletContext的getRealPath()方法获取。这些方法在设置上传文件存储路径时需注意路径分隔符和目录结构的正确处理,否则可能导致文件无法在指定目录下访问。原创 2018-02-02 15:44:51 · 11072 阅读 · 0 评论 -
java导出excel报表工具类
本文介绍了一个Java实现的Excel报表导出公共方法,主要用于非横向流动性报表导出。方法包含:1)初始化Excel工作簿和创建工作表;2)创建表头样式方法,设置居中、宋体、加粗、14号字体;3)创建表体样式方法,设置居中、宋体、12号字体;4)创建子表头和子表体样式方法,使用仿宋字体并设置灰色;5)定义表头内容数组;6)创建表头和表体内容填充方法。该方法封装了常用的Excel样式设置和内容填充功能,便于重复调用生成结构化的Excel报表。原创 2018-06-08 11:50:46 · 1596 阅读 · 1 评论 -
Springboot上传excel并将表格数据导入或更新mysql数据库
本文介绍了使用SpringBoot+MyBatis框架实现Excel文件导入MySQL数据库的后端解决方案。通过POI组件解析Excel数据,实现用户信息的批量导入,若用户已存在则执行更新操作。文章详细说明了实现流程:1)添加POI等依赖;2)定义User实体类;3)创建文件上传Controller接口;4)实现服务层逻辑,包括Excel文件校验、数据解析和数据库操作;5)配置Mapper映射文件和SQL语句;6)提供数据库建表语句。该方案采用前后端分离架构,支持.xls和.xlsx格式文件,包含数据格式校原创 2018-06-08 00:41:26 · 44784 阅读 · 30 评论