数据集的构造---faker库

当学习数据分析或做数据测试时,缺乏数据是一个常见问题。Faker是一个Python库,能方便地生成各种类型的伪数据,如姓名、地址和随机身份证号等,避免手动制造数据的繁琐。通过pip安装Faker后,可以实例化对象并选择不同国家的语言进行数据生成。官方文档和推荐的文章提供了更多详细方法和示例。
摘要由CSDN通过智能技术生成

学数据分析,没有数据怎么办?

做数据测试,没有数据怎么办?

如果要是手动制造数据的话,肯定要花费大把精力,这显然是不符合我们程序员的作风的。

那该怎么办呢?

快来使用Faker这个Python库吧,它可以生成各种各样的伪数据。

它可以制造很多数据,比如,姓名,地址,身份证号(随机制造的,不要担心是违法的)

安装库

pip安装

pip install Faker

IDE安装

直接在setting中搜索Faker即可,但需要注意的是这种方法可能会安装失败,这个时候换一下安装的版本就行了,造成这种情况的原因可能是你所用的python解释器的版本与Faker的高版本不兼容.

基本使用

引入模块

from faker import Faker

实例化对象

fake = Faker()

在实例化中传入相应的参数可以得到不同国家的随机数据集信息

ar_EG - Arabic (Egypt)
ar_PS - Arabic (Palestine)
ar_SA - Arabic (Saudi Arabia)
bg_BG - Bulgarian
bs_BA - Bosnian
cs_CZ - Czech
de_DE - German
dk_DK - Danish
el_GR - Greek
en_AU - English (Australia)
en_CA - English (Canada)
en_GB - English (Great Britain)
en_NZ - English (New Zealand)
en_US - English (United States)
es_ES - Spanish (Spain)
es_MX - Spanish (Mexico)
et_EE - Estonian
fa_IR - Persian (Iran)
fi_FI - Finnish
fr_FR - French
hi_IN - Hindi
hr_HR - Croatian
hu_HU - Hungarian
hy_AM - Armenian
it_IT - Italian
ja_JP - Japanese
ka_GE - Georgian (Georgia)
ko_KR - Korean
lt_LT - Lithuanian
lv_LV - Latvian
ne_NP - Nepali
nl_NL - Dutch (Netherlands)
no_NO - Norwegian
pl_PL - Polish
pt_BR - Portuguese (Brazil)
pt_PT - Portuguese (Portugal)
ro_RO - Romanian
ru_RU - Russian
sl_SI - Slovene
sv_SE - Swedish
tr_TR - Turkish
uk_UA - Ukrainian
zh_CN - Chinese (China Mainland)
zh_TW - Chinese (China Taiwan)

产生所要的随机信息

这个库对象的方法非常非常的多,在这里就不一一列举了,

大家可以到官方文档那里看

或者给大家推荐两篇文章,上面非常的清楚

https://zhuanlan.zhihu.com/p/87203290

https://zhuanlan.zhihu.com/p/138996322

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值