百度网盘
链接:https://pan.baidu.com/s/1i-4hhqpcXuCG4YWU8jdAPg
提取码:8y3n
智慧工业云服务企业名录2019-5-21保存了沈阳地区部分企业信息
以下皆是从上面excel中提取的信息,A.csv为分区结点,C.csv为行业结点,F.csv为法人结点,J.csv为经营结点,Q.csv为公司结点
Q2A为公司与分区关系,Q2C为公司与行业关系,Q2F公司与法人关系,Q2J为公司与经营关系,
A.csv数据的提取
python代码
import xlrd
import csv
workbook = xlrd.open_workbook(r"智慧工业云服务企业名录2019-5-21v1.0.xlsx")#文件名以及路径,如果路径或者文件名有中文给前面加一个r表示原生字符。
# 根据sheet索引或者名称获取sheet内容
Data_sheet = workbook.sheets()[1] # 通过索引获取
# Data_sheet = workbook.sheet_by_index(0) # 通过索引获取
# Data_sheet = workbook.sheet_by_name(u'名称') # 通过名称获取
print(Data_sheet.name)# 获取sheet名称
# 获取整行和整列的值(列表)
#rows = Data_sheet.row_values(0) # 获取第一行内容
def write_csv(write_data, filename):
#write_data-写入数据 filename-文件名
with open(filename, 'w', newline='',encoding='utf-8-sig') as csvFile:
writer = csv.writer(csvFile)
#writer.writerow([":ID","GID","name"])
# 写入多行用writerows
writer.writerows(write_data)
cols = Data_sheet.col_values(5) # 获取第6列内容
A=[]
A_elements=[[":ID","GID","name",":LABEL"]]
index=1
for col in cols[1:]:
element=[]
if col[-2:]=='新区':
col=col[:-2]
if col[-1]=='区' or col[-1]=='市' or col[-1]=='县':
col=col[:-1]
if col not in A:
A.append(col)
ID='A'+str(index)
element.append(ID)
element.append(ID)
element.append(col)
element.append("地区")
A_elements.append(element)
index+=1
print(A_elements)
write_csv(A_elements,'A.csv')
C.csv数据的提取
python代码
cols = Data_sheet.col_values(8)
C=[]
C_elements=[[":ID","GID","nam