Mac终端切分大的json文件为小的json文件

韩泰妍

于 2024-05-17 16:55:27 发布

阅读量217

点赞数 10

文章标签： json

本文链接：https://blog.csdn.net/weixin_44806820/article/details/139008286

版权

第一步，使用split切分json文件

我的文件是18G，所以设置了切分成每个文件1000000行

split -l 1000000 /Users/eda/Desktop/v3.1_oag_publication_1.json output/output_

split参数可见：

split切割文件命令详解

这时候生成的文件是文本文档，命名是output_aa,output_ab,…

第二步，重命名文件

首先切换到output文件夹：

cd output

然后重命名：

for file in *; do mv "$file" "$file.json"; done

完成！可以快乐处理了
（在colab使用python直接读取大的json会爆RAM）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

韩泰妍

关注关注

10
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

系统架构设计师【第2章】: 计算机系统基础知识 (核心总结)

数据知道的博客

05-29

7153

计算机系统 (Computer System)是指用于数据管理的计算机硬件、软件及网络组成的系统。它是按人的要求接收和存储信息，自动进行数据处理和计算，并输出结果信息的机器系统。计算机系统可划分为硬件(子系统)和软件(子系统)两部分。硬件由机械、电子元器件、磁介质和系统光介质等物理实体构成，例如处理器(含运算单元和控制单元)、存储器、输入设备和输出设备等。软件是一系列按照特定顺序组织的数据和指令，并控制硬件完成指定的功能。可将计算机软件进一步分为系统软件和应用软件：系统软件。

MacBook将大文件分割成很多个小文件split命

最新发布

yinjl123的博客

01-19

759

将大文件分割成很多个小文件。

参与评论您还未登录，请先登录后发表或查看评论

读取json文件切割图集

09-20

读取json文件切割图集，支持按目录批量裁剪，保留命名

json 文档拆分工具,将JSON文件拆分为单独的文件

weixin_39819671的博客

12-24

468

I have a large JSON file that is an object of objects, which I would like to split into separate files name after object keys. Is it possible to achieve this using jq or any other off-the-shelf tools?...

组合的json文件分隔或者拆分

04-04

450

一个txt文件，内部的json格式如下： { "名称": "#pagecontainer > div.main > div.app-msg > div.app-detail > div > h1", "大小": "#pagecontainer > div.main > div.detail-app-intro > div....

Json分割并解析

weixin_30527143的博客

12-28

1083

Json数据 [{'id':1,'name':'北京'},{'id':2,'name':'上海'},{'id':3,'name':'天津'},{'id':4,'name':'重庆'},{'id':5,'name':'香港'},{'id':6,'name':'澳门'},{'id':7,'name':'台湾'},{'id':8,'name':'黑龙江'},{'id':9,'name':'吉林'}...

使用Mac训练部署图片分类模型

m0_49079037的博客

07-21

812

可能有些同学学习机器的时候看了很多经典书籍介绍的各种算法，还是比较迷茫，不知道该怎么上手，又不知道怎么来解决问题，就算知道了，又发现需要准备环境、准备训练和部署的机器，有点麻烦。今天，我来给大家介绍一种容易上手的方法，给你现成的样本和代码，按照步骤操作，就可以在自己的 Mac 上体验运用机器学习的全流程啦~~~ 环境准备安装 Anaconda 下载地址：www.anaconda.com/products/in… 安装成功后，在终端命令行执行以下命令，使环境变量立即生效： $ sour.

Mac 配置教程-开发篇

MichaelHH

04-14

701

将 Mac 日常使用的软件和开发软件区分开，将之前写的 Mac 配置的文章分成了两篇： Mac 配置教程-日常篇 Mac 配置教程-开发篇图床 iPic 设置快捷键 Command+Shift+u PicGo 设置快捷键是 command+shift+p 免密登录 brew install ssh-copy-id ssh-copy-id root@1.2.3.4 # 等价...

【云计算与大数据概述】课堂笔记

weixin_55270959的博客

06-29

3161

第一章云计算的概念与发展 1.1 云计算简介云计算的技术内容包括分布式计算技术，虚拟化技术，网络技术，服务器技术，数据中心技术，云计算平台技术，存储技术等云计算的定义：一种基于互联网的计算方式，通过这种方式，共享的软硬件资源和信息可以按需求提供给计算机和其他设备（维基百科）云计算时代基本的3种角色：资源的整合运营者，资源的使用者，终端客户 1.2 云计算的发展历程 1.3 云计算的特点资源池弹性可扩张按需提供资源服务虚拟化网络化的资源接入高可靠性和安全性经济性 1.4云计算技术.

Python内置库与第三方库

NiuXL的编程技术网络日志

09-19

5204

文章目录1. 模块1.1 内置模块1.2 第三方模块1.3 自定义模块1.4 模块的定义1.5 模块的导入2. 内置模块2.1 sys2.2 os2.3 json2.4 pickle2.5 shutil2.6 time2.7 datetime2.8 logging2.9 md5加密2.10 getpass2.11 csv2.12 timeit2.13 Random3. 第三方模块3.1 第三方模...

Mac大文件分包split与合并cat,加密压缩zip

AI架构师易筋

02-14

3879

1. Mac分包与合并 1.1. 分包 split -b 50m {origin.zip} {pre-} 把压缩打包后的文件切割成每份50m的大小, 也可以换为单位K；origin.zip 为将要分包的大文件， pre-为分包后文件的名字前缀(如果没有默认x开头)。　　 1.2. 合并 cat x* > {result.zip} 把切割之后的文件合并成压缩打包文件；举栗子, 现...

JSON文件操作：合并多个JSON文件，提取JSON中某一字段

威廉软件的博客

03-15

3257

1.合并多个JSON文件将./source文件夹下的多个json文件合并为一个json文件存放于./merge/merge.json #将./source文件夹下多个json文件合并为一个json文件./merge/merge.json import os import json import tqdm def merge_json(path_results, path_merges): merges_file = os.path.join(path_merges, "merge.json

【Linux命令】mac/linux使用split和cat命令拆分合并tar.gz文件

小明2766的博客

05-08

3142

mac/linux使用split和cat命令拆分合并tar.gz文件问题描述：因为大文件上传到云服务器很花费时间，而且还可能传输失败，我们可以用分割文件的方法，对一个个小文件进行上传，再在linux服务器下合并起来。假设我有一个tar.gz文件，它的大小为242mb。我想要分割为2个文件，每个150M（或以下）。分割 split -b 150m -d -a 2 raw_sample.csv.tar.gz """ -b 150m：表示设置每个分割包的大小，单位还是可以k -d ：参数指定生成的分割包

Mac终端大文件 split（切分）成小文件

Haikuotiankong11111的博客

08-31

1万+

1.代码示例 (base) wangjianwendeMacBook-Air:~ wangjianwen$ split -b 800m imei.20190824.01 2.参数解释开头是split -b 第一个参数：目标文件大小，切割成的小文件一个多大。示例是800M，但是m要小写，如果是G则写g。第二个参数：被切割文件路径。示例是/Users/wangjianwen/Downloads...

Mac:Split文件分割命令

九师兄

11-12

7289

1.背景在宁波银行工作，发现一个包太大传不了，因此要转成小文件 split -b 300m cheetah-node-v1.1.0-SNAPSHOT.tgz cheetah-node-v1.1.0-SNAPSHOT.tgz. 那么会出现3个文件 cheetah-node-v1.1.0-SNAPSHOT.tgz.aa cheetah-node-v1.1.0-SNAPSHOT.tgz.ab che...

Mac OS X: 如何拆分一个DMG文件(Split/Segmnt DMG file)

中国在线教育

01-17

5405

很简单的一个问题，如果你知道Terminal命令: hdiutil segment -o -segmentCount [options] hdiutil segment -o -segmentSize [options] 只要把上面的命令中的换成目标文件名，/换成想要的数值，最后换成原来的DMG文件。例如:hdiutil segment -o ~/Des

Mac 下使用 ZIP 分卷压缩

热门推荐

hejisan的专栏

12-18

1万+

使用 zip 命令压缩文件使用 zip 命令压缩文件，并结合 split 命令来分卷： zip - largefile | split -b 500k 上述命令将文件 largefile 压缩成 zip 包并分卷成不超过 500k 的文件，分解后文件名默认是 x* ，后缀为 2 位 a-z 字母，如 aa、ab。要合并已分解的文件，可使用cat命令恢复成 zip 文件后使用 unz

Mac 上批量分割文件

weixin_30855761的博客

12-12

1340

split 分割文件命令 eg: split -l 10000000 data1.csv spfile. 其他命令可以再网上查询 shell 循环命令可以使用 for 循环 for((i=0;i<10;i++));do echo $i; done 也可使用 for i in `ls`;do echo $i; done 第二种方法可以遍历文件夹中的文件,所有根据第二种方法,改写 ...

python 切分大的json文件

09-12

### 回答1：你可以使用 Python 中的 json 模块来处理大的 json 文件。首先，你需要将大的 json 文件分割成多个小的 json 文件，然后逐个读取和处理这些小的 json 文件。具体的步骤如下： 1. 使用文件读取函数（如 open()）打开大的 json 文件，并逐行读取其中的内容。 2. 将读取到的内容转换成 Python 中的字典对象（使用 json.loads() 函数）。 3. 判断字典对象中是否包含你需要的数据，如果包含，则将该字典对象写入到一个新的 json 文件中（使用 json.dump() 函数）。 4. 重复步骤 2 和步骤 3，直到读取完整个大的 json 文件。 5. 关闭大的 json 文件和所有的小的 json 文件。这样，你就可以将大的 json 文件切分成多个小的 json 文件，并且只保留你需要的数据。 ### 回答2：对于切分大的JSON文件，可以使用Python中的json库进行处理。下面是一个简单的示例代码： ```python import json def split_json_file(file_path, chunk_size): # 读取原始JSON文件 with open(file_path, 'r') as file: json_data = json.load(file) # 获取JSON数据的总长度 total_len = len(json_data) # 计算切分的块数 num_chunks = total_len // chunk_size if total_len % chunk_size != 0: num_chunks += 1 # 切分并保存JSON数据块 for i in range(num_chunks): start_index = i * chunk_size end_index = (i + 1) * chunk_size # 避免切分超出总长度 if end_index > total_len: end_index = total_len # 切分JSON数据 json_chunk = json_data[start_index:end_index] # 保存JSON数据块 with open(f"json_chunk_{i}.json", 'w') as output_file: json.dump(json_chunk, output_file) ``` 以上代码定义了一个`split_json_file`函数，接受两个参数：文件路径和切分大小。函数首先读取原始JSON文件，然后计算需要切分的块数。在循环中，根据切分大小计算每个数据块的起始和结束索引，避免超出总长度。之后，将切分后的JSON数据块保存到新的JSON文件中，文件名以“json_chunk_数字.json”的形式命名。可以根据需要调整切分大小和文件命名方式。通过使用该函数，可以将大的JSON文件切分为多个较小的文件，方便后续处理和管理。 ### 回答3：在Python中，切分大的JSON文件可以使用以下方法。首先，我们可以使用`json`模块来读取和写入JSON文件。使用`json.load()`函数将JSON文件加载为Python的字典或列表，并使用`json.dump()`函数将Python对象转换为JSON格式并写入文件。接下来，我们可以使用`with`语句打开大的JSON文件，并逐行处理它。使用`readline()`函数逐行读取文件内容，并将每一行转换为Python对象。在处理每一行之前，可以使用`json.loads()`函数将其转换为字典或列表。然后，我们可以根据需求将大的JSON文件切割成多个小的JSON文件。可以通过设定每个小文件的行数或大小来进行切分。例如，可以设定每个小文件包含1000行，然后在处理大文件时计数行数，当达到1000行时，将当前的小文件写入磁盘，并创建一个新的小文件。最后，记得关闭打开的文件句柄来释放资源。下面是一个简单的示例代码来切分大的JSON文件： ```python import json def split_large_json(file_path, lines_per_file): json_file = open(file_path, 'r') output_file = None line_count = 0 file_count = 1 try: for line in json_file: # 处理每一行的JSON内容 json_data = json.loads(line) # 判断是否需要创建新的输出文件 if line_count % lines_per_file == 0: if output_file is not None: output_file.close() output_file = open(f'output_{file_count}.json', 'w') file_count += 1 # 将JSON数据写入输出文件 output_file.write(json.dumps(json_data) + '\n') line_count += 1 finally: json_file.close() if output_file is not None: output_file.close() # 示例调用 split_large_json('large.json', 1000) ``` 上述代码将会根据设定的行数将`large.json`文件切分为多个小文件，并以`output_1.json`、`output_2.json`、`output_3.json`等命名保存在当前目录中。每个输出文件中包含1000行JSON数据。请根据实际需求调整代码中的文件路径和切分行数，并确保文件能够被正常读取和写入。