中国姓氏排行研究

该项目研究了中国姓氏的排行,包括数据合并清洗、姓氏的'普遍指数'和'奔波指数'计算。重点分析了王姓和姬姓的分布,使用Echarts和Powermap展示了热力图和柱状图。同时,通过QGIS和Echart揭示了方姓的通勤动态图,揭示了人口迁徙情况。
摘要由CSDN通过智能技术生成

【项目09】 中国姓氏排行研究

PS:如果各位有疑问的话,可以留下微信,我看到会第一时间加的,以后可以多多交流

1、项目需求

1、数据合并及清洗
2、查看姓氏“普遍指数”,普遍指数=姓氏人口数量
3、查看姓氏“奔波指数”,奔波指数=姓氏人均迁徙距离。迁徙距离为户籍地所在地级市与现居住地所在地级市的距离

2、实现思路

1、清洗原数据,合并数据特殊处理未识别的数据,通过城市经纬度对照表得出地区经纬度
2、找出目标数据姓氏数量对多的TOP20,通过echart查看部分姓氏分布情况及powermap查看热力情况
3、选择一个姓氏通过qgis制作原始数据转换后,再通过echart制作通勤动态图,动态输出

3、实现步骤

1.1、导入模块读取数据

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
import warnings
warnings.filterwarnings('ignore') 
# 不发出警告

    from bokeh.io import output_file
    output_file('项目09.html')
    from bokeh.plotting import figure,show
    # 导入图表绘制、图标展示模块
    from bokeh.models.annotations import Span
    from bokeh.models.annotations import BoxAnnotation
    from bokeh.layouts import gridplot
    from bokeh.models import ColumnDataSource
    from bokeh.models import HoverTool
     
    os.chdir('C:\\Users\\Administrator\\Desktop\\项目资料\\项目09中国姓氏排行研究')
    df1_data1 = pd.read_csv('data01.csv',encoding = 'utf-8')
    df1_data2 = pd.read_csv('data02.csv',encoding = 'utf-8')
    df1_data3 = pd.read_excel('中国行政代码对照表.xlsx',sheetname = 0)

1.2、清洗数据合并数据

df1_data3['行政编码'] = df1_data3['行政编码'].values.astype(np.object)
df1_data3.columns = ['行政编码','户籍所在地_省','户籍所在地_市','户籍所在地_区/县','户籍所在地_lng','户籍所在地_lat']
df = pd.concat([d
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值