优化 Django 中 CSV 导入的速度

文章描述了在Django应用中导入大量CSV数据时遇到的性能问题,通过使用批量插入`bulk_create()`方法,解决了随着数据增加导入速度变慢的问题,并记录了时间以监控效率。
摘要由CSDN通过智能技术生成

在 Django 应用中导入一个城市列表的 CSV 文件时,导入速度会随着插入数据的增加而变慢。最初的 25,000 行数据可以在 5 分钟内导入,但接下来的 25,000 行数据却需要 2 个小时。即使重新启动导入,问题仍然存在。
在这里插入图片描述

2、解决方案
要解决此问题,可以在代码中使用批量插入操作。以下是优化后的代码示例:

def add_country(isocode, name, created_by, changed_by, country_list):
    country_list.append(Country(name=name.strip().replace('"', ''), isocode=isocode.strip()))

def add_state(country, isocode, name, statetype, created_by, changed_by, state_list):
    country_model = Country.objects.get(isocode=country.strip().lower())
    state_list.append(State(name=name.strip().replace('"', ''), isocode=isocode.strip().lower().replace('"', ''), country=country_model, statetype=statetype.strip().replace('"', '')))

def add_city(country, state, name, created_by, changed_by, city_list):
    country_model = Country.objects.get(isocode=country.strip().lower().replace('"', ''))
    try:
        state_model = State.objects.get(name=state.strip().replace('"', ''), country=country_model)
    except State.DoesNotExist:
        state_model = None
    city_list.append(City(name=name.strip().replace('"', ''), state=state_model, postcode=''))

country_list = []
state_list = []
city_list = []

print("Countries")
print(time.strftime("%H:%M:%S"))
with open('country.csv', 'rb') as csvfile:
    myreader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for counrow in myreader:
        add_country(counrow[0], counrow[1], adminuser, adminuser, country_list)

Country.objects.bulk_create(country_list)

print("States")
print(time.strftime("%H:%M:%S"))
with open('state.csv', 'rb') as csvfile:
    myreader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for counrow in myreader:
        add_state(counrow[0], counrow[1], counrow[2], counrow[3], adminuser, adminuser, state_list)

State.objects.bulk_create(state_list)

print("Cities 1")
print(time.strftime("%H:%M:%S"))
with open('city1.csv', 'rb') as csvfile:
    myreader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for counrow in myreader:
        add_city(counrow[0], counrow[1], counrow[2], adminuser, adminuser, city_list)

City.objects.bulk_create(city_list)

print("Cities 2")
print(time.strftime("%H:%M:%S"))
city_list = []
with open('city2.csv', 'rb') as csvfile:
    myreader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for counrow in myreader:
        add_city(counrow[0], counrow[1], counrow[2], adminuser, adminuser, city_list)

City.objects.bulk_create(city_list)

print("Cities 3")
print(time.strftime("%H:%M:%S"))
city_list = []
with open('city3.csv', 'rb') as csvfile:
    myreader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for counrow in myreader:
        add_city(counrow[0], counrow[1], counrow[2], adminuser, adminuser, city_list)

City.objects.bulk_create(city_list)

在优化后的代码中,使用了 bulk_create() 方法来批量插入数据。这种方法比逐行插入数据要快得多,因此可以显著提高导入速度。

此外,在代码中还使用了 time.strftime() 函数来记录导入每个文件的开始时间和结束时间,以便更好地观察导入速度的变化。

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Django,可以使用Python的内置csv模块来读取CSV文件,然后使用Django的ORM(对象关系映射)将数据保存到MySQL数据库。以下是示例代码: 1. 首先,创建一个Django命令来执行导入操作。在app目录下创建一个名为“importcsv”的文件夹,并在其创建一个名为“management”的文件夹。在“management”文件夹创建一个名为“commands”的文件夹,并在其创建一个名为“import_csv.py”的Python文件。 ```python # import_csv.py from django.core.management.base import BaseCommand import csv from app.models import MyModel class Command(BaseCommand): help = 'Import data from CSV file' def add_arguments(self, parser): parser.add_argument('csv_file', type=str) def handle(self, *args, **options): csv_file = options['csv_file'] with open(csv_file, 'r') as f: reader = csv.reader(f) for row in reader: obj = MyModel() obj.field1 = row[0] obj.field2 = row[1] obj.field3 = row[2] obj.save() self.stdout.write(self.style.SUCCESS('Data imported successfully!')) ``` 2. 在models.py文件定义模型类,以便在导入CSV文件时将数据保存到MySQL数据库。 ```python # models.py from django.db import models class MyModel(models.Model): field1 = models.CharField(max_length=100) field2 = models.CharField(max_length=100) field3 = models.CharField(max_length=100) ``` 3. 运行命令,将CSV文件导入MySQL数据库。 ```bash python manage.py import_csv /path/to/csv/file.csv ``` 其,/path/to/csv/file.csvCSV文件的路径。 这个命令将打开CSV文件,读取每一行并将数据保存到MySQL数据库。可以根据需要修改代码以处理更复杂的CSV文件格式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值