Python Faker库的使用

项目开发初期,为了测试方便,尽量模拟真实环境。比如要创建一批用户名,创建一段文本,电话号码,街道地址、IP地址等等。平时我们基本是键盘一顿乱敲,随便造个什么字符串出来,当然谁也不认识谁。现在你不要这样做了,用python中的Faker库就能满足你的一切需求。

  1. 什么是Faker
    Faker是一个Python包,开源的GITHUB项目,主要用来创建伪数据,使用Faker包,无需再手动生成或者手写随机数来生成数据,只需要调用Faker提供的方法,即可完成数据的生成。
项目地址:https://github.com/joke2k/faker
  1. 安装Faker
  • 方法一:
pip install faker

下载完成后输入faker -l zh_CN address,可生成地址即可。

  • 方法二:
    通过上方提供的github地址,来下载编译安装。
  1. Faker的使用
    3.1 Faker命令
    安装好了之后,可以在CMD或者Shell中通过faker命令来调试,具体如下:
 faker [-h] [--version] [-o output] 
 [-l {bg_BG,cs_CZ,...,zh_CN,zh_TW}] 
 [-r REPEAT] [-s SEP] 
 [-i {package.containing.custom_provider otherpkg.containing.custom_provider}] [fake] [fake argument [fake argument ...]]

3.2 参数说明

faker:是安装在您的环境时,脚本,在发展中可以使用,而不是python -m faker

		-h,--help:显示帮助消息

        --version:显示程序的版本号

        -o FILENAME:重定向输出到指定的文件名

        -l {bg_BG,cs_CZ,...,zh_CN,zh_TW}:允许使用本地化的供应商

        -r REPEAT:将生成的输出的特定数量的

        -s SEP:将生成的每个产生的输出后的指定的分隔

        -i {my.custom_provider other.custom_provider}:使用其他自定义供应商名单。请注意,是包含您提供一流的,而不是定制的Provider类本身包的导入路径。

        fake:是产生一个输出,该假的名称,如 name,address或text

        [fake argument ...]:可选参数传递到假(例如,简档假取的逗号分隔的字段名作为第一个参数的可选列表)
C:\Users\Codvision>faker -l zh_CN address
山西省明县友好王街e座 791390


C:\Users\Codvision>faker -l zh_CN profile
{'job': '保险产品开发/项目策划', 'company': '良诺科技有限公司', 'ssn': '130207199611298404', 'residence': '河南省西安市平山熊路q座 951956', 'current_location': (Decimal('-23.1935175'), Decimal('-84.549628')), 'blood_group': 'A-', 'website': ['http://najuan.com/', 'https://panlin.cn/', 'http://www.xiulan.cn/'], 'username': 'junzou', 'name': '陈丹', 'sex': 'F', 'address': '江西省哈尔滨市南长沈阳路d座 399315', 'mail': 'chaolai@gmail.com', 'birthdate': datetime.date(1943, 9, 30)}

3.3 简单使用

#引包
>>> from faker import Faker
#初始化
>>> fake = Faker(locale='zh_CN')
#生成姓名
>>> fake.name()
'李洁'
#生成地址
>>> fake.address()
'上海市兴安盟县江北东莞路r座 803484'

关于初始化参数locale:为生成数据的文化选项,默认为en_US,只有使用了相关文化,才能生成相对应的随机信息(比如:名字,地址,邮编,城市,省份等)
可选择的文化选项:

zh_CN - Chinese (China)    (简体中文)

zh_TW - Chinese (Taiwan)  (繁体中文)

ar_EG - Arabic (Egypt)        阿拉伯语 - 埃及

ar_PS - Arabic (Palestine)    阿拉伯语 - 巴勒斯坦

ar_SA - Arabic (Saudi Arabia)    阿拉伯语 - 沙特阿拉伯

bg_BG - Bulgarian        保加利亚语 - 保加利亚

cs_CZ - Czech               捷克语 - 捷克

de_DE - German            德语 - 德国

dk_DK - Danish            丹麦语 - 丹麦

el_GR - Greek            希腊语 - 希腊

en_AU - English (Australia)    英语 - 澳大利亚

en_CA - English (Canada)    英语 -  加拿大

en_GB - English (Great Britain)    英语 - 英国

en_US - English (United States)   英语 -  美国

es_ES - Spanish (Spain)        西班牙语 - 西班牙

es_MX - Spanish (Mexico)        西班牙语- 墨西哥

et_EE - Estonian            爱沙尼亚语 - 爱沙尼亚

fa_IR - Persian (Iran)        波斯语 - 伊朗

fi_FI - Finnish        芬兰语 - 芬兰

fr_FR - French         法语 - 法国

hi_IN - Hindi            印地语 - 印度

hr_HR - Croatian    克罗地亚语 - 克罗地亚

hu_HU - Hungarian    匈牙利语 - 匈牙利

hy_AM - Armenian 亚美尼亚语 - 亚美尼亚

it_IT - Italian       意大利语 -  意大利

ja_JP - Japanese    日语 - 日本

ko_KR - Korean    朝鲜语 - 韩国

ka_GE - Georgian (Georgia)  格鲁吉亚语 - 格鲁吉亚

lt_LT - Lithuanian    立陶宛语 - 立陶宛

lv_LV - Latvian    拉脱维亚语 - 拉脱维亚

ne_NP - Nepali    尼泊尔语 - 尼泊尔

nl_NL - Dutch (Netherlands)    德语 - 荷兰

no_NO - Norwegian    挪威语 - 挪威

pl_PL - Polish    波兰语 - 波兰

pt_BR - Portuguese (Brazil)    葡萄牙语  - 巴西

pt_PT - Portuguese (Portugal)    葡萄牙语 - 葡萄牙

ru_RU - Russian    俄语 - 俄国

sl_SI - Slovene   斯诺文尼亚语 - 斯诺文尼亚

sv_SE - Swedish    瑞典语 - 瑞典 

tr_TR - Turkish         土耳其语 - 土耳其

uk_UA - Ukrainian    乌克兰语 - 乌克兰

注意:在中国的一级行政单位,是省,直辖市,自治区;而日本的一级行政单位,是都、道、府、县。所以,日文包(ja_JP)中,就没有相应的province(),district(),取而代之的是prefecture(),town();在美国,一级行政单位又是洲,所以,在美国英语包(en_US)中,取而代之的是state();

在使用不同地区的Fake类之前,最好对所生成文化的国家、地区信息做初步的了解,建议先浏览其对应的类文件的成员。

3.4 常用方法一览

3.4.1 地理信息类
city_suffix():市,县
country():国家
country_code():国家编码
district():区
geo_coordinate():地理坐标
latitude():地理坐标(纬度)
longitude():地理坐标(经度)
postcode():邮编
province():省份
address():详细地址
street_address():街道地址
street_name():街道名
street_suffix():街、路

3.4.2 基础信息类

ssn():生成身份证号
bs():随机公司服务名
company():随机公司名(长)
company_prefix():随机公司名(短)
company_suffix():公司性质,如'信息有限公司'
credit_card_expire():随机信用卡到期日,如'03/30'
credit_card_full():生成完整信用卡信息
credit_card_number():信用卡号
credit_card_provider():信用卡类型
credit_card_security_code():信用卡安全码
job():随机职位
first_name_female():女性名
first_name_male():男性名
name():随机生成全名
name_female():男性全名
name_male():女性全名
phone_number():随机生成手机号
phonenumber_prefix():随机生成手机号段,如139

3.4.3 邮箱信息类

ascii_company_email():随机ASCII公司邮箱名
ascii_email():随机ASCII邮箱:
company_email():公司邮箱
email():普通邮箱
safe_email():安全邮箱

3.4.4 网络基础信息类

domain_name():生成域名
domain_word():域词(即,不包含后缀)
ipv4():随机IP4地址
ipv6():随机IP6地址
mac_address():随机MAC地址
tld():网址域名后缀(.com,.net.cn,等等,不包括.)
uri():随机URI地址
uri_extension():网址文件后缀
uri_page():网址文件(不包含后缀)
uri_path():网址文件路径(不包含文件名)
url():随机URL地址
user_name():随机用户名
image_url():随机URL地址

3.4.5 浏览器信息类

chrome():随机生成Chrome的浏览器user_agent信息
firefox():随机生成FireFox的浏览器user_agent信息
internet_explorer():随机生成IE的浏览器user_agent信息
opera():随机生成Opera的浏览器user_agent信息
safari():随机生成Safari的浏览器user_agent信息
linux_platform_token():随机Linux信息
user_agent():随机user_agent信息

3.4.6 数字信息

numerify():三位随机数字
random_digit():0~9随机数
random_digit_not_null():1~9的随机数
random_int():随机数字,默认0~9999,可以通过设置min,max来设置
random_number():随机数字,参数digits设置生成的数字位数
pyfloat():随机Float数字
pyint():随机Int数字(参考random_int()参数)
pydecimal():随机Decimal数字(参考pyfloat参数)

3.4.7 文本加密类

pystr():随机字符串
random_element():随机字母
random_letter():随机字母
paragraph():随机生成一个段落
paragraphs():随机生成多个段落
sentence():随机生成一句话
sentences():随机生成多句话,与段落类似
text():随机生成一篇文章
word():随机生成词语
words():随机生成多个词语,用法与段落,句子,类似
binary():随机生成二进制编码
boolean():True/False
language_code():随机生成两位语言编码
locale():随机生成语言/国际 信息
md5():随机生成MD5
null_boolean():NULL/True/False
password():随机生成密码,可选参数:length:密码长度;special_chars:是否能使用特殊字符;digits:是否包含数字;upper_case:是否包含大写字母;lower_case:是否包含小写字母
sha1():随机SHA1
sha256():随机SHA256
uuid4():随机UUID

3.4.8 时间信息类

am_pm():AM/PM

century():随机世纪

date():随机日期

date_between():随机生成指定范围内日期,参数:start_date,end_date取值:具体日期或者today,-30d,-30y类似

date_between_dates():随机生成指定范围内日期,用法同上

date_object():随机生产从1970-1-1到指定日期的随机日期。

date_this_month():

date_this_year():

date_time():随机生成指定时间(197011日至今)

date_time_ad():生成公元1年到现在的随机时间

date_time_between():用法同dates

future_date():未来日期

future_datetime():未来时间

month():随机月份

month_name():随机月份(英文)

past_date():随机生成已经过去的日期

past_datetime():随机生成已经过去的时间

time():随机24小时时间

timedelta():随机获取时间差

time_object():随机24小时时间,time对象

time_series():随机TimeSeries对象

timezone():随机时区

unix_time():随机Unix时间

year():随机年份

3.4.9 其他类别

currency_code():货币编码

color_name():随机颜色名

hex_color():随机HEX颜色

rgb_color():随机RGB颜色

safe_color_name():随机安全色名

safe_hex_color():随机安全HEX颜色

isbn10():随机ISBN(10位)

isbn13():随机ISBN(13位)

lexify():替换所有问号(“?”)带有随机字母的事件
  1. 实战使用
    在数据库建一张表,通过Faker造数据,插入到表中。并且打印Faker造的数据。
import pymysql
from faker import Faker

conn = pymysql.connect(host="localhost", port=3306, user="", password="", db="",charset="utf8")

cursor = conn.cursor()
sql1 = """drop table if exists faker_user"""
sql2 = """
create table faker_user(
pid int primary key auto_increment,
username varchar(20),
password varchar(20),
address varchar(35) 
)
"""
cursor.execute(sql1)
cursor.execute(sql2)
fake = Faker("zh-CN")
for i in range(20):
    sql = """insert into faker_user(username,password,address) 
    values('%s','%s','%s')""" % (fake.name(), fake.password(special_chars=False), fake.address())
    print('姓名:'+fake.name() + '|密码:'+fake.password(special_chars=False) + '|地址:'+fake.address())
    cursor.execute(sql)

conn.commit()
cursor.close()
conn.close()

输出的结果如下


姓名:王平|密码:iZqPxLO947|地址:吉林省莉市房山杨路R座 491718
姓名:柏倩|密码:h853B0idne|地址:辽宁省玉华县蓟州永安街g座 205585
姓名:贾俊|密码:UsRtGXAv9o|地址:湖北省石家庄市大兴傅街c座 861094
姓名:梁丹|密码:ke7QZBdBC3|地址:湖南省太原市璧山太原街m座 939225
姓名:丁燕|密码:Ee9Gt9Jh5E|地址:云南省颖县海港梁街A座 403237
姓名:余敏|密码:d2KhMqlen0|地址:江西省晶市城北深圳路E座 683731
姓名:朱冬梅|密码:aGpEzKJZ2a|地址:台湾省建市淄川张家港路F座 443320
姓名:韦小红|密码:ZDZXzsWiJ1|地址:河北省桂荣市朝阳贺街R座 559885
姓名:蓝艳|密码:tvDugIUra3|地址:湖北省西宁市和平李路n座 365745
姓名:黎雪|密码:Is1U1UAu57|地址:香港特别行政区六盘水市六枝特洪街e座 507272
姓名:刘利|密码:8zzbAEowYA|地址:辽宁省巢湖县西夏台北街k座 665328
姓名:董波|密码:q9TGizssrV|地址:台湾省桂芝市长寿大冶路v座 842339
姓名:刘志强|密码:Za9Vzdocki|地址:湖南省梅市门头沟梧州街r座 897061
姓名:涂飞|密码:9JFvmsO0r2|地址:辽宁省金凤市海港曾路z座 577420
姓名:仲秀英|密码:6MJXQ1w6qb|地址:贵州省淑英市朝阳蔡路r座 880809
姓名:赵冬梅|密码:7oUoUrw22Z|地址:湖北省斌市黄浦阜新路f座 635086
姓名:张丽丽|密码:5DnZJhfnnB|地址:香港特别行政区秀芳县高坪李路b座 543520
姓名:徐燕|密码:6WbRXyiY2R|地址:河北省惠州市锡山南宁路T座 266905
姓名:卫帅|密码:0XqEZPbiGZ|地址:贵州省福州县浔阳孙路L座 535933
姓名:李桂英|密码:6hLMsaqSI1|地址:重庆市辽阳市华龙姬街k座 718930
  • 4
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值