python-数据分析与可视化基础

1、data1.csv中的B、C、D和E列数据分别是日期、权重、A企业的销售额、B企业的销售额。读取C、D、E列数据,并统计E列数据的算术平均数、加权平均值(权值为C列数据)、方差、中位数、最小值、最大值。并绘制E列数据的直方图。

(1)源代码:

import numpy as np

import matplotlib.pyplot as plt



C, D, E = np.loadtxt("data1.csv", delimiter=',', usecols=(2, 3, 4), unpack=True, skiprows=1)



sum1 = np.sum(E)

print("E企业的销售额总和:", sum1)

mean1 = np.mean(E)

print("E企业的销售额的算术平均数:", mean1)

wavg1 = np.average(E, weights=C)

print("E企业的销售额的加权平均值为:", wavg1)

var1 = np.var(E)

print("E企业的销售额的方差为:", var1)

media1 = np.median(E)

print("E企业的销售额的中位数为:", media1)

min1 = np.min(E)

print("E企业的销售额的最小值:", min1)

max1 = np.max(E)

print("E企业的销售额的最大值:", min1)



plt.hist(E, bins=10, rwidth=0.8)

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.xticks(fontsize=15)

plt.yticks(fontsize=15)

plt.xlabel('E企业的销售额', fontsize=15)

plt.ylabel('出现次数', fontsize=15)

plt.title('E企业的销售额分布直方图', fontsize=18)

plt.show()

(2)运行结果截图 :

2、读取data1.csv文件中的A企业销售额与B企业销售额数据,并计算这些企业数据的协方差矩阵和相关系数矩阵。

(1)源代码:

import numpy as np



A, B = np.loadtxt('data1.csv', delimiter=',', usecols=(3, 4), unpack=True, skiprows=1)

covAB = np.cov([A, B])

relAB = np.corrcoef([A, B])

print('A,B企业数据的协方差矩阵为:')

print(covAB)

print('A,B企业数据的相关系数矩阵为:')

print(relAB)

(2) 运行结果截图 :

3、读取 datal.csv文件中A、B、C、D、E,绘制由A列和D列数据关联,以及由A列和E列数据(请将该列值除以120后绘图)关联的两条折线图,并分别赋以不同的颜色和线型,添加图例。

(1)源代码

import numpy as np

import matplotlib.pyplot as plt

s, a, b = np.loadtxt('data1.csv' , delimiter=',' ,

                   usecols=(0 , 3 , 4), unpack=True , skiprows=1)



plt.plot(s, a,'r*--',alpha=0.5,linewidth=1,label='A企业')

plt.plot(s,b/120,'go--',alpha=0.5,linewidth=1, label='B企业')

plt.rcParams['font.sans-serif']=['SimHei']

plt.legend()

plt.xlabel('时间')

plt.ylabel('销售额')

plt.title('A企业与B企业销售额走势图')

plt.show()

(2)运行结果截图

4、针对data1.csv中A企业的销售额,使用简单移动平均方法估计各月的销售额。移动平均间隔为3,即用1、2、3三周的数据预测第4周的数据。

(1)源代码

import numpy as np

import matplotlib.pyplot as plt



a= np.loadtxt('data1.csv',delimiter=',',usecols=3, unpack=True , skiprows=1)

winwide =3

weight = np.ones(winwide)/winwide

plt.rcParams['font.sans-serif']=['simHei']

aM = np.convolve(weight,a)

t = np.arange(winwide-1,len(a))

plt.figure(figsize=(15,10))

plt.subplot(1,2,1)

plt.plot(t,a[winwide-1:],lw=1.0,label='实际A企业的销售额')

plt.plot(t, aM[winwide-1:1-winwide],lw=3.0, label='A企业销售额的移动平均值')

plt.xticks(fontsize=15)

plt.yticks(fontsize=15)

plt.grid()

plt.title('A企业销售额',fontsize=18)

plt.legend(fontsize=10)

plt.subplots_adjust(wspace=0.2)

plt.show()

(2)运行结果截图

5.使用指数移动平均方法估计上题的A企业的销售额。移动平均间隔为3。并请添加图、坐标轴标题和图例。

(1)源代码

import numpy as np

import matplotlib.pyplot as plt



plt.rcParams['font.sans-serif']=['SimHei']

volume = np.loadtxt('data1.csv',delimiter=','

,usecols=3, unpack=True, skiprows=1)



winwide = 3

print('0bservation:\n',volume)

t= np.arange(winwide-1,len(volume))

print('time:\n',t)

weights = np.exp(np.linspace(-1,0,winwide))

weights /= weights.sum()

print('weights:\n',weights)

weightMovingAVG =np.convolve(weights,volume)

print('Prediction:\n',weightMovingAVG)

plot1 = plt.plot(t,volume[winwide-1:],lw=1.0)

plot2 = plt.plot(t, weightMovingAVG[winwide-1:1-winwide], lw=2.0)

plt.title('A销售额指数移动平均',fontsize=18)

plt.xticks(fontsize=15)

plt.yticks(fontsize=15)

plt.xlabel('时间顺序',fontsize=15)

plt.ylabel('A企业销售额',fontsize=15)

plt.legend((plot1[0],plot2[0]),('真实值','指数移动平均值'),

loc='upper right',fontsize=13,numpoints=1)

plt.show()

(2)运行结果截图

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python数据分析可视化Python数据分析可视化方面的应用。Python拥有许多强大的数据分析可视化库,使得Python成为许多数据科学家和分析师的首选语言。 在Python数据分析中,最常用的库包括NumPy、Pandas、Matplotlib和Seaborn。NumPy是一个用于数值计算的Python库,可以处理大量的数值数据;Pandas是一个基于NumPy的库,用于数据处理和分析;Matplotlib是一个用于数据可视化Python库;Seaborn是建立在Matplotlib之上的一个高级数据可视化库,可以帮助用户创建各种类型的图形。 在Python可视化方面,除了Matplotlib和Seaborn外,还有其他一些库,如Plotly、Bokeh和ggplot等。这些库提供了各种类型的图表,例如散点图、折线图、饼图、直方图、热力图等等。 通过Python数据分析可视化,用户可以有效地分析和展示数据,从而得出有用的结论和见解。 ### 回答2: Python数据分析可视化是使用Python编程语言进行数据处理、分析和可视化的一种能力。Python作为一种高级编程语言,具有易于学习和使用的特点,而且其强大的数据分析可视化库使得其成为进行数据分析可视化的理想选择。 Python数据分析库如Pandas和NumPy提供了丰富的数据结构和功能,能够方便地对数据进行处理、清洗和转换。Pandas的DataFrame和Series结构可以灵活地处理和操作数据,而NumPy提供了高效的数值计算和矩阵操作。 在数据分析过程中,Python可视化库如Matplotlib和Seaborn能够帮助我们更好地理解和展示数据。Matplotlib提供了各种各样的绘图功能,包括线图、散点图、柱状图、饼图等,而Seaborn则提供了更加美观和统计学上合理的绘图风格。 使用Python进行数据分析可视化,我们可以通过统计分析、图表和图形展示等方式来发现数据的规律和趋势。我们可以通过数据分析来挖掘数据中的关联性和趋势,从而为业务决策提供支持;同时,我们也可以通过可视化手段将庞大和复杂的数据转化为直观和易于理解的图形,使得我们能够更好地理解和传达数据。 总的来说,Python数据分析可视化是一门将数据处理、分析和可视化技术有机结合的能力,通过Python的强大的数据分析可视化库,我们可以更加方便地进行数据分析和呈现,从而更好地理解和利用数据。 ### 回答3: Python数据分析可视化是指使用Python编程语言进行数据处理、分析和展示的过程。Python语言以其简洁、易读的特点,以及强大的数据处理和可视化库而在数据分析领域得到广泛应用。 在数据分析方面,Python提供了很多功能强大的库,如NumPy、Pandas和SciPy。NumPy是Python科学计算的基础库,提供了高效的数组操作和数值计算工具。Pandas是一个用于数据处理和分析的库,提供了数据结构和操作工具,能够轻松地处理和操作数据集。SciPy提供了许多用于科学计算的函数和工具,能够进行统计分析、线性代数、优化和插值等操作。 在可视化方面,Python有多个强大的绘图库,如Matplotlib、Seaborn和Plotly。Matplotlib是Python中最常用的绘图库,提供了各种类型的2D图表绘制功能,包括折线图、柱状图、散点图等。Seaborn是一个基于Matplotlib的统计数据可视化库,通过一些简单的函数调用,可以轻松创建各种统计图表。Plotly是一个交互式可视化库,可以创建动态、可交互的图表,方便用户探索数据和进行数据分析Python数据分析可视化的过程通常包括以下步骤:数据收集和清洗、数据处理和分析、数据可视化和结果展示。首先,需要收集和清洗原始数据,保证数据的完整性和准确性。然后,使用Python的数据处理库,对数据进行清洗、筛选和转换等操作,以便后续的分析。接下来,使用Python的统计分析和机器学习库,对数据进行各种统计测试、建模和预测。最后,使用Python可视化库,通过绘制图表、绘制地图等方式,展示数据分析的结果,帮助用户更好地理解数据和结论。 总而言之,Python数据分析可视化是一种以Python语言基础数据分析可视化方法,通过Python强大的数据处理和可视化库,实现数据的整理、处理、分析和展示。这种方法简单、灵活、易于上手,使得数据分析工作变得高效且有趣。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值