国民经济行业分类与代码(GB/T 4754-2002、GB/T 4754-2011、GB/T 4754-2017)并存入MySQL数据库【可获取下载】...

戳链接下载:https://download.csdn.net/download/weixin_45556024/34913490

或关注公众号【靠谱杨阅读人生】回复【行业】获取。

整理不易,资源fu费,谢谢理解!

2002标准表格式示例

2002数据库

注意事项:字段的长度要保证足够长。

 代码:

 1 import pandas as pd
 2 import pymysql
 3 """
 4 ------------------------------------------------------------------------------------
 5 """
 6 def get_conn():
 7     """
 8     :return: 连接,游标
 9     """
10     # 创建连接
11     conn = pymysql.connect(host="127.0.0.1",
12                     user="root",
13                     password="000429",
14                     db="data_cleaning",
15                     charset="utf8")
16     # 创建游标
17     cursor = conn.cursor()  # 执行完毕返回的结果集默认以元组显示
18     return conn, cursor
19 
20 def close_conn(conn, cursor):
21     if cursor:
22         cursor.close()
23     if conn:
24         conn.close()
25 """
26 -----------------------------------------------------------
27 """
28 """
29 ------------------------------------------------------------------------------------
30 """
31 def query(sql,*args):
32     """
33     通用封装查询
34     :param sql:
35     :param args:
36     :return:返回查询结果 ((),())
37     """
38     conn , cursor= get_conn()
39     print(sql)
40     cursor.execute(sql)
41     res = cursor.fetchall()
42     close_conn(conn , cursor)
43     return res
44 """
45 ------------------------------------------------------------------------------------
46 """
47 count=0     #计算四位编码个数
48 def into_mysql(filename):
49     category_code = ""      #门类编码
50     category_name = ""      #门类名称
51     global count
52     conn,cursor=get_conn()  #连接mysql
53     if(conn!=None):
54         print("数据库连接成功!")
55     tempres = []            #暂存列表
56     df=pd.read_excel(filename)      #读取标准表
57     # print(len(df.index))
58     for i in range(len(df.index.values)):   #第一层遍历标准表 找到门类的编码和名称 找到小类的编码
59         # print(df.loc[i][1])
60         code=str(df.loc[i][0])           #所有的编码
61         name=str(df.loc[i][1])           #所有的名称
62         if len(code)==1:
63             category_code=code     #门类编码
64             category_name=name     #门类名称
65         #分割编码
66         if len(code)==4:
67             count=count+1
68             small_class=name        #小类名称
69             new_code_2=code[:2]     #分割出两位编码    之后确定大类名称
70             new_code_3=code[:3]     #分割出三位编码    之后确定中类名称
71             print(category_code)    #最终的字符串需要门类的编码ABCD和门类的名称
72             print(new_code_2)
73             print(new_code_3)
74             for j in range(len(df.index.values)):   #第二次遍历 寻找不同的位数的编码对应不同的名称
75                 if new_code_2==df.loc[j][0]:
76                     big_class=df.loc[j][1]    #大类名称
77                 if new_code_3==df.loc[j][0]:
78                     mid_class=df.loc[j][1]    #中类名称
79             tempres.append(category_code+code)              #列表暂存A0511 编码
80             tempres.append(category_name+"·"+big_class+"·"+mid_class+"·"+small_class)   #列表暂存完整的名称
81             print(tempres)
82             #====================================================================================
83             SQL = "insert into std_code_2017 (code,name) values('"+tempres[0]+"','"+tempres[1]+"');"     #sql插入语句
84             cursor.execute(SQL)             #执行sql语句
85             conn.commit()                   #提交事务
86             print("--------------------------------------------------")
87             # ====================================================================================
88             tempres=[]          #清空列表
89     close_conn(conn,cursor)     #关闭数据库连接
90     print("所有的四位编码数:\n",count)
91     return None
92 if __name__ == '__main__':
93     filename="GBT4754-2017.xlsx"
94     into_mysql(filename)

数据库表

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Industrial classification for national economic activities (UNSD:2006,International standard industrial classification of all economic activities,NEQ) 一、分类的原则和规定 1.划分行业的原则 本标准采用经济活动的同质性原则划分国民经济行业。即每一个行业类别按照同一种经济活动的性质划分,而不是依据编制、会计制度或部门管理等划分。 2.行业分类的基本单位 参照联合国《所有经济活动的国际标准产业分类》(ISIC Rev. 4),本标准主要以产业活动单位和法人单位作为划分行业的单位。采用产业活动单位划分行业,适合生产统计和其他不以资产负债、财务状况为对象的统计调查;采用法人单位划分行业,适合以资产负债、财务状况为对象的统计调查。 在以法人单位划分行业时,应将由多法人组成的企业集团、集团公司等联合性企业中的每个法人单位区分开,按单个法人单位划分行业。 3.确定单位行业归属的原则 本标准按照单位的主要经济活动确定其行业性质。当单位从事一种经济活动时,则按照该经济活动确定单位的行业;当单位从事两种以上的经济活动时,则按照主要活动确定单位的行业。 二、编码方法和代码结构 1.本标准采用线分类法和分层次编码方法,将国民经济行业划分为门类、大类、中类和小类四级代码由一位拉丁字母和四位阿拉伯数字组成。 门类代码用一位拉丁字母表示,即用字母A、B、C、……、T依次代表不同门类;大类代码用两位阿拉伯数字表示,打破门类界限,从01开始按顺序编码;中类代码用三位阿拉伯数字表示,前两位为大类代码,第三位为中类顺序代码;小类代码用四位阿拉伯数字表示,前三位为中类代码,第四位为小类顺序代码。 2.本标准的中类和小类,根据需要设立带有“其他”字样的收容项。为了便于识别,原则上规定收容项的代码尾数为“9”。 3.当本标准大类、中类不再细分时,代码补“0”直至第四位。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

靠谱杨

感谢您的认可和鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值