python利用faker库批量生产一千条模拟数据

  引言:本人从小白自学python,为了测试基础学习效果,增加一定的促进,想通过参加全国计算机等级考试二级python来检验基础学习情况。在学习过程中,会将该过程编写的python小程序题目在此发表,希望找到共同学习的人一起讨论,可能发表的有许多不是很完善的地方,请大家指正。后期学习路线,还会继续通过参加一些社会类的考试来检验学习成果。高阶段学习的话,可能会参加一些python的比赛,或者自己接一些项目,然后会根据自己的情况将一些项目的Python程序在此分享。
 

码字不易,求赞,求关注,求赏

一、本项目来源:在学习数据分析时,经常需要模拟数据来进行测试,使用faker库可以快速自动生成批量的模拟数据。faker库可以根据针对不同国家生成该国家相符合的数据,可以很好的进行数据分析测试。

二、先上传代码。

import faker
import pandas as pd

fake = faker.Faker('zh_CN')

# print(fake.phone_number())

def get_data():
    name = fake.name()
    address = fake.address()
    number = fake.phone_number()
    id_card = fake.ssn()
    birth_date = id_card[6:14]
    email = fake.email()
    key_list = ['姓名','详细地址','手机号码','身份证号码','出生年月','邮箱']
    info_list = [name,address,number,id_card,birth_date,email]
    person_info = dict(zip(key_list,info_list))
    return person_info

df = pd.DataFrame(columns=['姓名','详细地址','手机号码','身份证号码','出生年月','邮箱'])
for i in range(1000):
    df1 = pd.DataFrame([get_data()])
    df = pd.concat([df,df1])
df.to_excel("模拟数据1.xlsx",index=None)

三、代码解读

这段代码主要用到了faker和pandas两个库,所以写代码之前,记得要下载这两个库。

pip install faker/pandas

pip install faker/pandas -i http://pypi.douban.com/simple/

定义一个函数,利用faker库中相应随机名字等生成相应的数据

然后利用for循环1000次,调用定义的函数,自动生成1000条数据

利用pandas库中的DataFrame生成对应的数据条目

最后导出成excel

四、脚本运行效果(生成的图片审核未通过,大家自己运行试试吧)

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python小白的逆袭之路

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值