废话不多说,直接上代码:
#!usr/bin/env python
#coding: utf-8
########### ***notice*** ########################
# 这个程序使用了Django 的ORM 机制
# 因此需要指定django项目的路径以及setting 文件的位置
#################################################
import os
import sys
# ***请修改这行***
#project_path = '/var/www/html/confmgr'
project_path = 'D:\\workspace_myeclipse8.5\\confmgr'
sys.path.append(project_path)
os.environ['DJANGO_SETTINGS_MODULE'] = 'confmgr.settings'
from django.db import models, connection
from django.conf import settings
# our own code
from openpyxl.reader.excel import load_workbook
from openpyxl.workbook import Workbook # workbook相关
from openpyxl.writer.excel import ExcelWriter
from domain.models import Domain
from isp.models import ISPModel
'''
* 获得记录类型
* @param record_type;
* @return record_type;
*
'''
def get_record_type(record_type):
if record_type == u'A':
return u'1'
elif record_type == u'CNAME':
return u'2'
elif record_type == u'MX':
return u'3'
elif record_type == u'TXT':
return u'4'
elif record_type == u'NS':
return u'5'
elif record_type == u'SRV':
return u'6'
elif record_type == u'AAAA':
return u'7'
elif record_type == u'显性URL':
return u'8'
elif record_type == u'隐性URL':
return u'9'
else:
return u'1'
'''
* 获得线路类型
* @param link_type;
* @return link_type;
*
'''
def get_link_type(link_type):
if link_type == u'默认':
return u'1'
elif link_type == u'电信':
return u'2'
elif link_type == u'联通':
return u'3'
elif link_type == u'铁通':
return u'4'
else:
return u'1'
'''
* 获得域名状态
* @param 域名状态;
* @return 域名状态;
*
'''
def get_status(status):
if status == u'enabled':
return u'1'
elif status == u'在用':
return u'1'
elif status == u'暂停':
return u'2'
elif status == u'已下线':
return u'3'
else:
return u'1'
def uploadfile():
'''
导入excel文件
'''
#读取excel2007文件
wbook = load_workbook(filename = r'file/domain.xlsx')
wsheet = wbook.worksheets[0] # 取第一张表
rows = wsheet.get_highest_row() # 行数
column = wsheet.get_highest_column() # 列数
for row in range(1, rows):
try:
# 域名
domain_name = wsheet.cell(row = row, column = 0).value.strip() if wsheet.cell(row = row, column = 0).value != None else ''
# 记录类型
record_type = get_record_type(wsheet.cell(row = row, column = 1).value.strip()) if wsheet.cell(row = row, column = 1).value != None else ''
# 记录
record = wsheet.cell(row = row, column = 2).value.strip() if wsheet.cell(row = row, column = 2).value != None else ''
# 线路 类型
link_type = get_link_type(wsheet.cell(row = row, column = 3).value.strip()) if wsheet.cell(row = row, column = 3).value != None else ''
# 域名状态
status = get_status(wsheet.cell(row = row, column = 4).value.strip()) if wsheet.cell(row = row, column = 3).value != None else ''
domain = Domain(domain_name = domain_name,
record_type = int(record_type),
record = record,
link_type = int(link_type),
status = int(status),
desc = '')
domain.save()
except Exception, e:
print e
print "success!"
def main():
for isp in ISPModel.objects.all():
print isp.ispName
if __name__ == '__main__':
#main()
uploadfile()
在最下面链接一篇讲openpyxl用法的文章,转自:http://blog.csdn.net/hxsyewlink/article/details/6265790
python有很多模块都是用来操作excel的,比如xlrd,xlwt,pyExcelerator。用着很方便,但是问题是,只能支持到excel2003。虽然一般的应用其实足够了,但是如果遇到了导出大量数据(超过65535条)的需求时,excel2003就不够用了。所以我就只好去找一个能支持excel2007的模块。
google了一下,发现了这个openpyxl,不过网上也没什么中文的文档可以看,于是就自己琢磨琢磨。
I.安装
openpyxl的最新版本是1.5.0 下载地址 http://pypi.python.org/pypi/openpyxl/1.5.0
需求python的版本是2.6+ ,也就是说,如果centOS系统的机器想用,那得升级系统的python。。。
安装就是解压缩,然后cd到目录,然后
python setup.py install
你懂的~
II.读取excel2007文件
- #-*- coding:utf-8 -*
- from openpyxl.reader.excel import load_workbook
- import MySQLdb
- import time
- #开始时间
- startTime = time.time()
- #读取excel2007文件
- wb = load_workbook(filename = r'empty_book.xlsx')
- #显示有多少张表
- print "Worksheet range(s):", wb.get_named_ranges()
- print "Worksheet name(s):", wb.get_sheet_names()
- #取第一张表
- sheetnames = wb.get_sheet_names()
- ws = wb.get_sheet_by_name(sheetnames[0])
- #显示表名,表行数,表列数
- print "Work Sheet Titile:",ws.title
- print "Work Sheet Rows:",ws.get_highest_row()
- print "Work Sheet Cols:",ws.get_highest_column()
- # 建立存储数据的字典
- data_dic = {}
- #把数据存到字典中
- for rx in range(ws.get_highest_row()):
- temp_list = []
- pid = ws.cell(row = rx,column = 0).value
- w1 = ws.cell(row = rx,column = 1).value
- w2 = ws.cell(row = rx,column = 2).value
- w3 = ws.cell(row = rx,column = 3).value
- w4 = ws.cell(row = rx,column = 4).value
- temp_list = [w1,w2,w3,w4]
- data_dic[pid] = temp_list
- #打印字典数据个数
- print 'Total:%d' %len(data_dic)
注意的是ws.cell()方法,支持的参数有两种,cell(coordinate=None, row=None, column=None)
coordinate坐标,eg ws.cell("B1")
row 和 column 是行和列 ,都是从0开始
还有,如果想取得格里的值,得用ws.cell("A1").value 取到,如果用过xlrd,因为写法差不多,可能就会忘记加value了。
III.写入excel2007
- 写excel2007
- #-*- coding:utf-8 -*
- import MySQLdb
- import time
- import sys
- #workbook相关
- from openpyxl.workbook import Workbook
- #万恶的ExcelWriter,妹的封装好了不早说,封装了很强大的excel写的功能
- from openpyxl.writer.excel import ExcelWriter
- #一个eggache的数字转为列字母的方法
- from openpyxl.cell import get_column_letter
- #新建一个workbook
- wb = Workbook()
- #新建一个excelWriter
- ew = ExcelWriter(workbook = wb)
- #设置文件输出路径与名称
- dest_filename = r'empty_book.xlsx'
- #第一个sheet是ws
- ws = wb.worksheets[0]
- #设置ws的名称
- ws.title = "range names"
- #录入数据,注意col是数字转字母,然后需要限定%s(string型)当参数传到ws.cell()方法中去,records可以想象为一个从数据库里查询出来的数据集合
- i=1
- table = {}
- for record in records:
- for x in range(1,len(record)+1):
- col = get_column_letter(x)
- ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])
- i+=1
- #又建了一个sheet,ws名字都没变,太省了。。。但是确实是一个新的sheet,不会影响之前那个sheet的东西
- ws = wb.create_sheet()
- ws.title = 'Pi'
- ws.cell('F5').value = 3.14
- #写文件
- ew.save(filename = dest_filename)
注意的地方:
# col是用列号x为参数,调用了这个模块的get_column_letter方法算出来的字母,这个比较蛋疼。
col = get_column_letter(x)
#在为数据格赋值的时候,注意写的格式:要不会有各种不靠谱的问题出现(这个是用坐标的方式写的,其实用row ,col的方式可能没那么麻烦)
ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])
关于该模块的API 可以查询官方文档 http://packages.python.org/openpyxl/api.html
总体来说,这个模块还是挺方便的,但是问题就是在对于python的版本有一定要求,如果在centOs上用,可能会有些问题。
本文只是简单的写了下使用的方法,之后格式超链接神马的之后再填上~
关于pyExcelerator的使用教学,给朋友做个广告 http://blog.csdn.net/suofiya2008/archive/2010/05/14/5589627.aspx