使用python 造一百万条数据

目录

一.创建文件

二.编写代码


一.创建文件

1.打开pyCharm创建python文件

二.编写代码

1.创建Faker对象,设置为中文,需要安装faker软件包。

pip install faker
from faker import Faker  #它来生成各种各样的伪数据(随机)
fake = Faker('zh_CN')

2.生成的数据行数,也就是我们的一百万条数据,一百万行方便用表格表示。

num_rows = 1000000

3.定义我们想要的数据,我这里是学历,前面的英语单词也必须是学历的英语单词,也可以改为其他数据,有中文就要有它的英文。

education = ["小学学历", "初中学历", "高中学历", "专科学历", "本科学历", "硕士学历", "博士学历"]

4.打开文件用于写入数据,使用PythonUTF-8编码的写入模式(“'w'”)中打开一个名为“data.csv”的文件。然后,为包含CSV文件列名的文件写一行标题:“姓名”、“年龄”、“性别”和“学历”。

with open('data.csv', 'w', encoding='utf-8') as file:
    # 写入CSV文件头
    file.write('姓名,年龄,性别,学历\n')

5.生成并写入数据,

fake.name()使用一些库(可能是faker或类似)来生成一个随机的中文名称。

random.randint(18, 99)产生18至99岁的随机年龄。

random.choice(['男', '女'])随机选择“男”(男性)或“女”(女性)作为性别。

random.choice(education)education列表中随机选择一个教育级别。假education列表在您的代码中的某个地方定义。

file.write(f'{name},{age},{gender},{education1}\n')将生成的数据以逗号分隔行写入CSV文件。循环的每个迭代都会为文件添加一行新行。

因此,在运行此循环num_rows次后,您的CSV文件将包含随机生成的数据行,每行数据都带有中文名称、年龄、性别和学历。

注意:在运行此代码之前,请务必导入必要的的库(fakerandom)并定义education列表。此外,您提供的代码片段中的缩进似乎不一致,这可能会导致缩进错误。确保实际代码中的正确缩进。

 for _ in range(num_rows):
        # 随机生成中文姓名、年龄、性别和学历
        name = fake.name()
        age = random.randint(18, 99)  # 假设年龄在18到99之间
        gender = random.choice(['男', '女'])  # 随机选择性别
        education1 = random.choice(education)  # 随机选择学历

        # 将数据写入CSV文件
        file.write(f'{name},{age},{gender},{education1}\n')

6.最后打印出来。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值