分离测评集数据是为了将原先混在一行的数据 变成一行是一行,方便自动化测评(至少半自动化)。
先分离测评集数据,name和des分开放:
fin = open("序列标注")
fout1 = open("val_name", mode="w", encoding="utf8")
fout2 = open("val_des", mode="w", encoding="utf8")
for l in fin:
line = l.rstrip().split("\t")
pro = line[0].split('[SEP]')
name = pro[0]
des = pro[2]
t = line[3]
ner = line[4]
ner2entity = line[5]
if_correct = line[6]
if t == "name":
row = "{}\t{}\t{}\t{}\n".format(name, ner, ner2entity, if_correct)
fout1.write(row)
if t == "des":
row = "{}\t{}\t{}\t{}\n".format(des, ner, ner2entity, if_correct)
fout2.write(row)
fin.close()
fout1.close()
fout2.close()
序列标注
:
万科城市花园等一卡通项目[SEP]客户谈判,计划预定,现场实施以及技术支持客户培训等。[SEP]一卡通项目在智能化小区的配套与实施 一卡通项目 1 des ['一卡通项目'] [[('一卡通项目', 1.0)]] 1
夜嗅APP项目[SEP]主要负责项目推广活动文案的撰写和辅助APP的微信公众号的运营维护。[SEP]夜嗅APP是基于郑州本地开发的一款夜生活社交软件,有主题party、同城聚活动和团购等功能,服务本地商家,为郑州年轻人的夜生活提供资源和保障的一个软件,目前处于前期推广阶段。 夜嗅APP项目 1 name ['夜嗅APP项目'] [[('app项目', 0.88)]] 1
其他项目[SEP]以需求分析或项目经理角色参与项目过程[SEP]湖南电信智能小区物业管理平台、广东省电信实业公司财务系统、武汉游轮销售与运营管理系统、海南省干部考勤考绩管理系统 电信智能小区物业管理平台_领域_34_45 1 des ['湖南电信智能小区物业管理平台'] [[('智能物业管理平台', 0.846)]] 1
其他项目[SEP]以需求分析或项目经理角色参与项目过程[SEP]湖南电信智能小区物业管理平台、广东省电信实业公司财务系统、武汉游轮销售与运营管理系统、海南省干部考勤考绩管理系统 电信实业公司财务系统_领域_50_59 1 des ['电信实业公司财务系统'] [[('财务系统', 0.782)]] 1
val_name
:
夜嗅APP项目 ['夜嗅APP项目'] [[('app项目', 0.88)]] 1
val_des
:
一卡通项目在智能化小区的配套与实施 ['一卡通项目'] [[('一卡通项目', 1.0)]] 1
湖南电信智能小区物业管理平台、武汉游轮销售与运营管理系统、海南省干部考勤考绩管理系统 ['湖南电信智能小区物业管理平台'] [[('智能物业管理平台', 0.846)]] 1
广东省电信实业公司财务系统、武汉游轮销售与运营管理系统、海南省干部考勤考绩管理系统 ['电信实业公司财务系统'] [[('财务系统', 0.782)]] 1
写自动测试脚本,分别使用name和des自动发送请求,logger中得到清晰的返回结果,方便评估:
import requests
def get_list(t):
if t == "name":
path = "val_name"
if t == "des":
path = "val_des"
fin = open(path)
lst = []
for l in fin:
txt = l.split('\t')[0]
lst.append(txt)
return lst
def test_name():
lst = get_list("name")
for i in lst:
request_data = {"project_name": "",
"project_des": "",
"link_type": "simi"}
request_data["project_name"] = i
url = 'http://192.168.7.224:51688/project_recognize'
result = requests.post(url=url, json=request_data)
print(result.text)
# test_name()
def test_des():
lst = get_list("des")
for i in lst:
request_data = {"project_name": "",
"project_des": "",
"link_type": "simi"}
request_data["project_des"] = i
url = 'http://192.168.7.224:51688/project_recognize'
result = requests.post(url=url, json=request_data)
print(result.text)
test_des()