tf18: 根据姓名判断性别

MachineLP

于 2016-12-25 14:28:10 发布

阅读量1w

点赞数 6

CC 4.0 BY-SA版权

分类专栏：机器学习 Deep learning TensorFlow练习汇总文章标签： Tensorflow

本文链接：https://blog.csdn.net/u014365862/article/details/53869732

TensorFlow练习汇总同时被 3 个专栏收录

49 篇文章 ¥39.90 ¥99.00

订阅专栏

机器学习

292 篇文章

订阅专栏

Deep learning

175 篇文章

订阅专栏

博主分享了如何利用TensorFlow构建一个能够根据姓名预测性别的CNN模型，训练数据集为自爬取的35万个中文姓名。此外，该数据集还可用于训练起名模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本帖训练一个可以根据姓名判断性别的CNN模型；我使用自己爬取的35万中文姓名进行训练。

使用同样的数据集还可以训练起名字模型，参看：

准备姓名数据集

我上网找了一下，并没有找到现成的中文姓名数据集，额，看来只能自己动手了。

我写了一个简单的Python脚本，爬取了上万中文姓名，格式整理如下：

姓名,性别
安镶怡,女
饶黎明,男
段焙曦,男
苗芯萌,男
覃慧藐,女
芦玥微,女
苏佳琬,女
王旎溪,女
彭琛朗,男
李昊,男
利欣怡,女
# 貌似有很多名字男女通用

数据集:https://pan.baidu.com/s/1hsHTEU4。

训练模型

import tensorflow as tf
import numpy as np
 
name_dataset = 'name.csv'
 
train_x = []
train_y = []
with open(name_dataset, 'r') as f:
	first_line = True
	for line in f:
		if first_line is True:
			first_line = False
			continue
		sample = line.strip().split(',')
		if len(sample) == 2:
			train_x.append(sample[0

了解本专栏