【办公类-19-01-03】办公中的思考——Python,统计孩子名字的同音字（拼音）-CSDN博客

本文链接：https://blog.csdn.net/reasonsummer/article/details/129627144

文章讲述了中班班主任运用Python进行姓名拼音分析，以帮助记忆孩子们的名字，特别是处理同姓和同音字的情况。通过将名字转为拼音并进行词频分析，教师能更准确地区分和记忆孩子们的名字，同时这种活动也促进了孩子们对名字和拼音的认识。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、现象：

现在我是中班的班主任了，本周都在强化记忆孩子们的名字。

1、前期已经知道班级里的同姓最多：

因此，我有意识地在背诵姓氏时，考虑思考另几位同姓的人是谁？

情景1：找找同姓氏的人

师：你是HHM，姓H，你知道班级里还有谁姓H吗？

HHM想不出，老师提示他看另一桌的同学。

HHM：还有HEC。

师：两位H同学，是好兄弟！

HHM：H老师也是H

师：对啊，H老师也姓H

情景2：还有一个G同学

师：你是G同学。

W：你为什么叫GWY叫G同学。

师：因为班级只有一位姓G的同学哦

W：GXY也是G哦

（姓氏完全同音，但不同字）

情景3：我们班还有姓Z的人

师：Z同学，坐下来！不要跑！

Q：他叫ZRL，不叫Z同学。

师：是的，我叫Z同学，因为你们班只有他一个人姓Z。

Q：我们班还有Z阿姨（保育员）姓Z

（姓氏完全同音，但不同字）

情景4：还有一个Y

已知班级里有3位孩子名字里有“一”

师：QYC，你的名字里有一，你知道还有谁名字里也有“一”

QYC：CFY、GXY，CYJ

师：CYJ名字里没有“一”

QYC：?

师：哦，你说的对，CYJ的“依”也读“Y”

情景5：三人姓氏同字或名字同音

师：你是不是LQY？

LQY：不是，我叫ZZY

师：对不起，我又搞错了，你和ZZY两个长的很像，都很白，有两个辫子。你是ZZY，她是LQY。

LQY：你上次就叫错我的名字！”

师：我也要反复背你们名字。

师：（问旁L1右边的女孩）你是谁？

LZX：我是LZX

师：哦，你和LQY都姓L

LZX：看了LQY，互相微笑。

师：你和ZZY名字里都有Z。

LZX想了想点头：我们三个是好姐妹！

小结：在辨认姓氏“X同学”的过程中，我和孩子们就他们的姓氏、名字进行讨论。孩子们给我新的提示：他们并不认识字，是通过字音来分辨名字中的相同字。一些字形不同，但读音相同的字也可以成为频数分析的内容

因此，我需要将名字转化为拼音，进行Python词频分析。

二、重点代码：

1、把名字转为拼音，不需要再用EXCLE拼音转换，安装pip 即可

2、cmd 安装

3-01 上代码（不考虑声调）


from pandas import DataFrame, Series
import pandas as pd
import numpy as np
import xlrd
from xpinyin import Pinyin

 # 读取列
worksheet = xlrd.open_workbook(r'D:\test\02办公类\08姓氏最多的人\中6班.xls')
sheet_names= worksheet.sheet_names()
print(sheet_names)

for sheet_name in sheet_names:
    sheet = worksheet.sheet_by_name(sheet_name)
    rows = sheet.nrows # 获取行数
    cols = sheet.ncols # 获取列数，尽管没用到
    all_content = []
    cols = sheet.col_values(1) # 获取第二列内容， 数据格式为此数据的原有格式(原：字符串，读取：字符串；  原：浮点数， 读取：浮点数)

    print(cols[1:])
    # ['张三', '李四', '王五刘', '朝气吧'……]
    print(type(cols[1:]))    #查看数据类型 <class 'list'>

listall=[]
for x in cols[1:]:
    for y in x:
        p = Pinyin()
        result1 = p.get_pinyin('{}'.format(y))
        print(result1)
        listall.append(result1)
print(listall)
# ['zhang', 'san', 'li', 'si', 'wang'……]

#     # 'ye-fu-tian'
#     # result2 = p.get_pinyin('叶伏天', tone_marks='marks')
#     # 'yè-fú-tiān'

name_dict = {}
for name in listall:
    # 取出字典中的所有keys值     
    key_list = name_dict.keys()
    # key_list = name_dict[0]
    # print(key_list)
    if name in key_list:
        name_dict[name] += 1
    else:
        name_dict[name] = 1

# # 根据字典中的value值进行倒序排序

name_dict = sorted(name_dict.items(), key=lambda item:item[1], reverse=True)
print(name_dict )

d=[]
for c in range(0,len(name_dict)):
    aa=name_dict[c][0]
    bb=name_dict[c][1]
    print(aa,bb)
    # zhang 1
    # san 1
    # li 1
    # si 1

3-02、上代码（考虑声调）


from pandas import DataFrame, Series
import pandas as pd
import numpy as np
import xlrd
from xpinyin import Pinyin

 # 读取列
worksheet = xlrd.open_workbook(r'D:\test\02办公类\08姓氏最多的人\中6班.xls')
sheet_names= worksheet.sheet_names()
print(sheet_names)

for sheet_name in sheet_names:
    sheet = worksheet.sheet_by_name(sheet_name)
    rows = sheet.nrows # 获取行数
    cols = sheet.ncols # 获取列数，尽管没用到
    all_content = []
    cols = sheet.col_values(1) # 获取第二列内容， 数据格式为此数据的原有格式(原：字符串，读取：字符串；  原：浮点数， 读取：浮点数)

    print(cols[1:])
    # ['张三', '李四', '王五刘', '朝气吧'……]
    print(type(cols[1:]))    #查看数据类型 <class 'list'>

listall=[]
for x in cols[1:]:
    for y in x:
        p = Pinyin()
        # result1 = p.get_pinyin('{}'.format(y))
        result1 = p.get_pinyin('{}'.format(y), tone_marks='marks')
        print(result1)
        listall.append(result1)
print(listall)
# ['zhang', 'san', 'li', 'si', 'wang'……]

#     # 'ye-fu-tian'
#     # result2 = p.get_pinyin('叶伏天', tone_marks='marks')
#     # 'yè-fú-tiān'

name_dict = {}
for name in listall:
    # 取出字典中的所有keys值     
    key_list = name_dict.keys()
    # key_list = name_dict[0]
    # print(key_list)
    if name in key_list:
        name_dict[name] += 1
    else:
        name_dict[name] = 1

# # 根据字典中的value值进行倒序排序

name_dict = sorted(name_dict.items(), key=lambda item:item[1], reverse=True)
print(name_dict )

d=[]
for c in range(0,len(name_dict)):
    aa=name_dict[c][0]
    bb=name_dict[c][1]
    print(aa,bb)
    # zhang 1
    # san 1
    # li 1
    # si 1