关于不同形式的数组、字典保存为txt文件

1.将csv/xlsx(表格)文件,提取每行为两个汉字的行保存为txt文件

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
lc = pd.DataFrame(pd.read_csv('cnword.csv','rb',header=0,dtype=str))
df = lc[lc["词语"].str.len() == 2]
df.to_excel('newWord.xlsx')

原始文件:cnword.csv

 提取后文件:newWord.xlsx

 2.将numpy数组保存为txt文件

with open("zi_vecters_3908_dim_100.txt","a") as f:
    for i in train_set_0:
     z = encode(i)
     np.savetxt(f,z[None])

原始:为多维数组

embeddings= [[0.002345  0,16347 0.1267 -0.64878 ],                          

                       [0.002345  0,16347 0.1267 -0.64878 ],

                       [0.002345  0,16347 0.1267 -0.64878]]

保存后:每个向量显示为一行

 3,将字典中嵌套列表的数据,保存为txt

 np.set_printoptions(linewidth = np.inf)#在txt中每行显示的个数,设置为无限大
 np.set_printoptions(suppress=True)#不显示为科学计数法
 with open('hanzi_embeddings.txt','w',encoding='utf-8') as f:
     for key in embeddings:
        f.writelines(str(key)+''+str(embeddings[key].lstrip('[').rstrip(']'))#删除数组括号
        f.write('\n')

原始数据:embeddings= {'同':[0.002345  0,16347 0.1267 -0.64878 ],

                                         '名':[0.002345  0,16347 0.1267 -0.64878]

                                                        }

保存为txt:每一个向量,一行显示,为:键:值得形式

 4.将数组保存为txt 

print(g.edges)//两个节点

with open('hanzi_edgeList.txt','w',encoding='utf-8') as fw:
     for line in edge:
         for a in line:
             fw.write(a)
             fw.write('\t')
         fw.write('\n')
fw.close()

原始数据:

保存后的txt:

 

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值