readlines,lambda,map,json

readlines函数

readline和readlines在读取文件中的文本时经常用到,readlines返回的是包含每行文本的一个列表,其中每个文本的结尾是\n
[‘…\n’,…]

lambda函数

lambda(参数:表达式)

load = lambda file:open(file,'r',encoding='utf-8').readlines
load('./data/train.txt')

map函数

根据提供的函数来做指定的映射
map(function,[iterable])
当不提供函数时,map等同于zip
map和匿名函数连用

map(lambda x:x+2,[int,..])

json

json的定义:json是指 java script对象表示法,独立于语言,是轻量级的文本数据交换格式。
常用的方法
json.load():从json文件中读取数据
json.dump():将数据以json的类型写入文件

json.loads():将str类型的数据转换成dict类型
json.dumps():将dict类型的数据转换成str

# origin_data_row:{'content':'x','entity':{'x1':y1,'x2':y2}}
data_all = open(file_name,'r',encoding='utf-8').readlines()
# data_all:['{'content':'x','entity':{'x1':y1,'x2':y2}}\n',..]
data = map(json.loads,data_all)
# map:['{'content':'x','entity':{'x1':y1,'x2':y2}}\n',..]  type=dict
output = []
# expected out shape:[{'content':'text','x1':y1,'x2':y2},..]
for item in tqdm(data):
	# item:{'content':'x','entity':{'x1':y1,'x2':y2}}\n}
	output_item = {}
	text = item['content']
	# except prompt:'{x1[mask]}{x2[mask]}'
	prompt = ''.join(['{x_i}{mask}' for x_i in item['entity']])
	input = tokenizer.__call__(text)
	out_item['input'] = input
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

石头猿rock

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值