excel数据处理之分列:仅根据第一个分隔符分列

我用word2vec训练了词向量模型,保存为txt文件。现需转为csv文件,导入向量数据库,以下是格式转换过程,仅记录学习过程以供后续参考。

原始数据为txt文件,用Excel打开后格式如下:

 可以看出其词是由一个英文实体词加上“/ME”或“/DO”加上一串数字构成的。后面对应的是其向量。现在我希望将实体词及其对应向量分为两列方便读取,但词和向量以及向量每个维度之间均用空格隔开。因此,可以使用excel公式来帮助解决:

通用公式

在第一个空格之前获取所有内容的通用公式

=LEFT(A1,FIND(" ",A1)-1)

在第一个空格之后获取所有内容的通用公式

=RIGHT(A1,LEN(A1)-FIND(" ",A1))

转换后的数据如B、C两列所示。

参数

A1:代表包含您将被第一个空格分割的文本字符串的单元格。

参考:https://zh-cn.extendoffice.com/excel/formulas/excel-split-by-first-space.html

 

你可以使用以下步骤在 Matlab 中将 Excel 数据按行拆分并绘制坐标图: 1. 在 Matlab 中导入 Excel 文件,可以使用 `xlsread` 函数。 2. 读取 Excel 文件中的数据,并将其存储为一个矩阵。 3. 使用 `strsplit` 函数将每行数据按分隔符进行拆分,并将其存储为一个单元格数组。 4. 将单元格数组转换为数字数组,并将其存储为一个矩阵。 5. 使用 `plot` 函数绘制坐标图。 以下是一个示例代码,假设你的 Excel 文件名为 `data.xlsx`,其中数据以逗号作为分隔符: ```matlab % 导入 Excel 文件 [num,txt,raw] = xlsread('data.xlsx'); % 将数据存储为矩阵 data = num(:, 1:end); % 将每行数据按逗号分隔并存储为单元格数组 splitData = cell(size(data)); for i = 1:size(data, 1) splitData{i, :} = strsplit(txt{i+1, 1}, ','); end % 将单元格数组转换为数字数组,并存储为矩阵 splitData = cellfun(@str2double, splitData, 'UniformOutput', false); splitData = cell2mat(splitData); % 绘制坐标图 plot(splitData(:, 1), splitData(:, 2), 'o-'); xlabel('x轴'); ylabel('y轴'); title('坐标图'); ``` 注意,上述代码中 `txt` 变量是用于存储 Excel 文件中的文本数据的,因此需要将其与数字数据区分开来。在示例代码中,我们假设文本数据位于 Excel 文件的第一列,并且使用 `strsplit` 函数按逗号拆分每一行数据。如果你的 Excel 文件中的数据以其他分隔符分隔,请将 `strsplit` 函数的参数相应地进行更改。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值