python的数据分析可视化

本文介绍了使用Python进行数据分析和可视化的实践过程,包括所用到的包和代码,详细展示了如何实现各种功能。
摘要由CSDN通过智能技术生成

以下为本次数据分析可视化的全部包

import os
import math
from PIL import Image
from pyecharts.charts import Pie
from pyecharts.charts import Bar
from pyecharts.charts import WordCloud
#用于设值全局配置和系列配置
from pyecharts import options as opts
import csv
import xlrd
import re
import jieba
from snownlp import SnowNLP
import matplotlib.pyplot as plt
import numpy as np
from pyecharts.charts import Graph
from collections import Counter
from pyecharts.charts import Map
from pyecharts.charts import Geo
from pyecharts.charts import Gauge
from pyecharts.charts import Liquid

 以下为本次数据分析可视化的所有文件

以下为分布代码,以及实现的功能:

'''
    例子1:饼状图统计好友男女比例
'''
# 1.1 读取csv文件,把性别信息读取出来
def getSex(filename):
    lstsex = []
    with open(filename,'r') as fr:
        reader = csv.reader(fr)
        for i in reader:
            lstsex.append(i[4])
    return lstsex
# 1.2 性别pyecharts可视化
def VisualSexpyechart(lstsex):
    sex = dict()
    # 2.1 提取好友性别信息,从1开始,因为第0个是自己
    for f in lstsex[1:]:
        if f == '1': # 男
            sex['man'] = sex.get('man',0) + 1
        elif f== '2': # 女
            sex['women'] = sex.get('women',0) + 1
        else: # 未知
            sex['unknown'] = sex.get('unknown',0) + 1
    # 在屏幕上打印出来
    total = len(lstsex[1:])
    # 2.2打印出自己的好友性别比例
    print("男性好友:%.2f%%" %(float(sex['man']) / total*100) + '\n' + "女性好友:%.2f%%" %(float(sex['women']) / total*100) +
          "不明性别好友:%.2f%%" %(float(sex['unknown']) / total*100))
    # 2.3使用pyecharts饼状图
    attr = ['男性好友','女性好友','不明性别好友']
    value = [sex['man'],sex['women'],sex['unknown']]
    # 饼图用的数据格式是[(key1,value1),(key2,value2)],所以先使用 zip函数将二者进行组合
    data_pair = [list(z) for z in zip(attr, value)]
    # 初始化配置项,内部可设置颜色
    (
        Pie(init_opts=opts.InitOpts(bg_color="white"))
        .add(
            # 系列名称,即该饼图的名称
            series_name="性别分析",
            # 系列数据项,格式为[(key1,value1),(key2,value2)]
            data_pair=data_pair,
            # 通过半径区分数据大小 “radius” 和 “area” 两种
            rosetype='',
            # 饼图的半径,设置成默认百分比,相对于容器高宽中较小的一项的一半
            radius="55%",
            # 饼图的圆心,第一项是相对于容器的宽度,第二项是相对于容器的高度
            center=["50%", "50%"],
            # 标签配置项
            label_opts=opts.LabelOpts(is_show=True, position="center"),
        )
        # 全局设置
        .set_global_opts(
            # 设置标题
            title_opts=opts.TitleOpts(
                # 名字
                title="微信好友性别比例",
                # 组件距离容器左侧的位置
                pos_left="center",
                # 组件距离容器上方的像素值
                pos_top="20",
                # 设置标题颜色
                title_textstyle_opts=opts.TextStyleOpts(color="black"),
            ),
            # 图例配置项,参数 是否显示图里组件
            legend_opts=opts.LegendOpts(is_show=True),
        )
        # 系列设置
        .set_series_opts(
            tooltip_opts=opts.TooltipOpts(
                trigger="item", formatter="{a} <br/>{b}: {c} ({d}%)"
            ),
            # 设置标签颜色
            label_opts=opts.LabelOpts(color="black"),
        )
        .render('好友性别比例.html')
    )
# 1.3 性别pyecharts 柱状图可视化
def VisualSexpyechart2(lstsex):
    sex = dict()
    # 2.1 提取好友性别信息,从1开始,因为第0个是自己
    for f in lstsex[1:]:
        if f == '1':  # 男
            sex['man'] = sex.get('man', 0) + 1
        elif f == '2':  # 女
            sex['women'] = sex.get('women', 0) + 1
        else:  # 未知
            sex['unknown'] = sex.get('unknown', 0) + 1
    # 在屏幕上打印出来
    total = len(lstsex[1:])
    # 2.2打印出自己的好友性别比例
    print(
        "男性好友:%.2f%%" % (float(sex['man']) / total * 100) + '\n' + "女性好友:%.2f%%" % (
                float(sex['women']) / total * 100) + '\n' +
        "不明性别好友:%.2f%%" % (float(sex['unknown']) / total * 100))
    # 2.3使用pyecharts饼状图
    attr = ['男性好友', '女性好友', '不明性别好友']
    value = [sex['man'], sex['women'], sex['unknown']]
    # # 饼图用的数据格式是[(key1,value1),(key2,value2)],所以先使用 zip函数将二者进行组合
    # data_pair = [list(z) for z in zip(attr, value)]
    # 初始化配置项,内部可设置颜色
    bar = (
        Bar()
            .add_xaxis(attr)
            .add_yaxis("amount", value, color='green')
            .set_global_opts(
            title_opts=opts.TitleOpts(title='微信数据分析'),
            yaxis_opts=opts.AxisOpts(name="amount"),
            xaxis_opts=opts.AxisOpts(name="sex")
        )

    ).render('好友性别比例2.html')

 

 

'''
    例子2:柱状图学生省份和城市分析
'''
# 2.1读取省份信息
def getProvince(filename):
    Province1 = {}
    Province2 &
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Python是一种非常流行的编程语言,被广泛用于数据科学领域。它提供了许多库和工具,使数据分析可视化变得更加简单和方便。下面列举几个Python数据分析可视化实例的源代码: 1. 使用Matplotlib库绘制简单的折线图: ```python import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.plot(x, y) plt.xlabel('X-axis') plt.ylabel('Y-axis') plt.title('Simple Line Graph') plt.show() ``` 2. 使用Seaborn库绘制带有标签的散点图: ```python import seaborn as sns import pandas as pd df = pd.read_csv('data.csv', delimiter=',') sns.scatterplot(x='x_axis_data', y='y_axis_data', hue='label_data', data=df) plt.title('Labelled Scatterplot') plt.show() ``` 3. 使用Pandas库绘制柱状图: ```python import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data.csv', delimiter=',') df.plot(kind='bar', x='categories', y='values') plt.title('Bar Chart') plt.xlabel('Categories') plt.ylabel('Values') plt.show() ``` 以上三个例子仅是Python数据分析可视化中的冰山一角,实际上还有很多其他的技术和工具可以应用到数据的可视化中。通过这些可视化的方式,能够更直观地展示数据,帮助我们更好地了解和分析数据,为我们制定决策提供更准确的依据。 ### 回答2: Python数据分析可视化是目前常见的数据分析方法之一,通过将数据用图表、图形等形式展示出来,可以更加直观地了解数据的特点、趋势和异常情况等。 对于Python数据分析可视化实例可以参考如下代码: 首先导入所需的库 ```python import matplotlib.pyplot as plt import pandas as pd import seaborn as sns ``` 然后读取数据 ```python df = pd.read_csv('data.csv') ``` 接下来通过matplotlib绘制散点图 ```python plt.scatter(df['x'], df['y']) plt.title('Scatter Plot') plt.xlabel('x') plt.ylabel('y') plt.show() ``` 在此基础上进行可视化分析,比如加入颜色和规格化等信息 ```python sns.scatterplot(df['x'], df['y'], hue=df['color'], style=df['symbol'], s=df['size']) plt.title('Scatter Plot') plt.xlabel('x') plt.ylabel('y') plt.show() ``` 使用seaborn实现这样的代码可以更加灵活直观地展示数据分析结果,让人们可以快速将数据分析思路转化为可视化结果。 综上,Python数据分析可视化实例可以通过利用常见的库和工具进行代码实现,这不仅简化了数据分析的流程,也让数据分析结果得到更加直观清晰的展示。 ### 回答3: Python数据分析可视化实例源码是指采用Python语言编写的数据分析程序,并且具有可视化效果。这些源码可以通过开源社区、GitHub等途径获取,也可以在机器学习和数据分析相关的书籍中找到。下面以Python数据分析常用的matplotlib库为例,简单介绍其中的源码: 一、散点图 散点图是一种用于研究两个变量之间关系的图形。在Python中,使用matplotlib库中的scatter函数可以绘制散点图。下面是一个简单的示例代码: import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] plt.scatter(x, y) plt.show() 该代码可以生成一张包含5个散点的散点图。 二、折线图 折线图是一种用于表示连续数据的图形,它是一条或多条曲线沿着水平轴绘制,其中横坐标通常表示时间或其他连续变量。在Python中,使用matplotlib库中的plot函数可以绘制折线图。下面是一个简单的示例代码: import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] plt.plot(x, y) plt.show() 该代码可以生成一张包含5个点的折线图。 三、直方图 直方图是一种用于表示频率分布的图形,通常用于展示数据的分布情况。在Python中,使用matplotlib库中的hist函数可以绘制直方图。下面是一个简单的示例代码: import matplotlib.pyplot as plt data = [1, 2, 3, 4, 5] plt.hist(data, bins=5) plt.show() 该代码可以生成一张包含5个条状图的直方图,每个条状图表示一个数据区间的数量。 以上三种数据可视化方式只是Python数据分析中的冰山一角,在实际应用中还有很多数据可视化技术,可以灵活运用,以更好地从数据中获取价值信息。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值