广州python数据分析实例

各位朋友们,小编在这里要分享,利用python进行数据分析 github 利用python进行数据分析案例,让我们开始吧!

文章目录

背景问题一及其解答问题解答总程序框图子程序1子程序2子程序3数据流图程序代码问题二及其解答问题解答总程序框图子程序1子程序2子程序3数据流图程序代码知识点总结

背景

《命运》和《寻梦》都是著名科幻作家倪匡的科幻作品PHP与Python:哪个更快上手?。这里给出一个《命运》和《寻梦》的网络版本,文件名为“命运-网络版.txt”和“寻梦-网络版.txt”。

问题一及其解答

问题

请编写程序,对这两个文本中出现的字符进行统计,字符与出现次数之间用冒号:分隔,将两个文件前 100 个最常用字符分别输出保存到“命运-字符统计.txt”和“寻梦-字符统计.txt”文件中,该文件要求采用 CSV 格式存储,参考格式如下(注意,不统计回车字符):‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

命:90, 运:80, 寻:70, 梦:60‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬(略)

解答
总程序框图

Created with Raphaël 2.2.0 开始 子程序1:统计文件中字符个数 子程序2:对字符个数进行排序 子程序3:将排序后的字符保存在文件中 结束

子程序1

Created with Raphaël 2.2.0 开始子程序1 以只读方式打开文件, 并保存为行文本列表lines 初始化字典stat 循环遍历行文本列表lines 的元素——字符串line, 是否到达行文本lines末尾 进入子程序2 循环遍历字符串line的 元素——字符elm,是否 达到字符串line的末尾 移动到行文本列表lines的 下一个字符串元素line elm是否为字典的键 将字典中键elm的值加1 移动到字符串line的下一个键elm 将字典中键elm的值设置为0 yes no yes no yes no

子程序2

Created with Raphaël 2.2.0 开始子程序2 删除字典键stat为“\n”的键值对 利用list函数将字典stat转化成列表ls0 利用list方法对列表ls0进行排序 循环遍历列表ls0 的元素——元组(k,v), 是否达到 列表ls0的末尾 进入子程序3 格式化字符串k:v 将字符串k:v添加到列表ls中 移动到列表ls0的下一个元组(k,v) yes no

子程序3

Created with Raphaël 2.2.0 开始子程序3 以只写方式打开文件 在列表ls的元素间加入逗号 并将列表ls写入文件 结束总程序

数据流图

文本 txt 读入文本 txt 行文本列表 lines 将列表 lines转化 成字符串 line 字符串 line 字符串 line 将字符串 line转化 成字符 elm 字符 elm 对字符 elm进行统计 并保存为字典 stat 字典 stat 字典 stat 利用 list函数将字典 stat转化成列表 ls0 列表 ls0 对列表 ls0进行格式化 格式化后的列表 ls0 格式化后的列表 ls0 在列表 ls0元素间 插入逗号 改变格式后 的列表 ls0 将列表 ls0保存到 文本 txt 文本 txt

程序代码
with open("寻梦-网络版.txt",'r',encoding="UTF-8") as fi:
    lines = fi.readlines()

stat = {}
for line in lines:
    for elm in line:
##        if elm in stat:
##            stat[elm] +=1
##        else:
##            stat[elm] = 0
        stat[elm] = (elm,0)+1

del stat['\n']
ls0 = list(stat.items())
(key = lambda x:x[1], reverse = True)

ls = []
##for i in range(100):
##    k,v = ls0[i]
##    ls.append("{}:{}".format(k,v))

for (k,v) in ls0:
##    k,v = ls0[i]
    ls.append("{}:{}".format(k,v))

with open("寻梦-字符统计.txt",'w',encoding='UTF-8') as fo:
    fo.writelines(",".join(ls[0:100]))

print(",".join(ls[0:10]))

问题二及其解答

问题

请编写程序,对“命运-字符统计.txt”和“寻梦-字符统计.txt”中出现的相同字符打印输出。“相同字符.txt”文件中,字符间使用逗号分隔。

解答
总程序框图

Created with Raphaël 2.2.0 开始 子程序1: 读取文本“命运-字符统计.txt” 和“寻梦-字符统计.txt”, 并保存为行列表ls和ls1 子程序2: 利用函数GetWordList() 提取列表ls和ls1中 的字符,并保存在ls2和ls3中。 子程序3: 查找ls2和ls3列表中的相同字符, 并将相同字符存储在ls4中。 结束

子程序1

Created with Raphaël 2.2.0 开始子程序1 以只读方式打开文件 “命运-字符统计.txt”和“命运-字符统计.txt”, 并保存为行文本列表ls和ls1 进入子程序2

子程序2

Created with Raphaël 2.2.0 开始子程序2 输入列表InputList,截取长度length 初始化列表WordList 循环变量i是否小于 截取长度length 将标记flag设置为True 循环变量j是否小于列表 InputList[i]长度 InputList[i][j]的元素 ——字符是否为“:” 将标记flag设置为False 标记flag是否为True 将WordList的元素 ——字符增加到列表中 移动到输入字符串InputList[i] 的下一个元素 移动到输入列表InputList 的下一个元素 输出包含字符的列表WordList 进入子程序3 yes no yes no yes no yes no

子程序3

Created with Raphaël 2.2.0 开始子程序3 循环遍历列表 ls2的元素 ——字符char, 是否达到列表 ls2的末尾 结束 将char增加到列表ls4中 移动到列表ls3的下一个元素 yes no

数据流图

文本 txt 读入文本 txt, 并以逗号进行分割 列表 ls,ls1 利用函数 GetWordList 将输入列表 InputList 转化成 WordList 列表 WordList 列表 WordList 收集相同字符 并保存在列表 ls4中 列表 ls4 将列表
原文地址1:https://blog.csdn.net/yimsdn/article/details/100929280
python手册 http://www.78tp.com/python/

  • 26
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python数据分析实例源码是一些帮助数据科学家、工程师和数据分析师在Python平台上进行数据分析的代码示例。这些示例代码可以帮助数据分析人员快速理解和掌握Python数据分析的基本原理和技能。 这些源码示例可以涵盖从数据清洗、可视化、机器学习到人工智能等领域的数据分析问题,例如: 1. 数据清洗:包括数据预处理、数据格式化、数据过滤等等,比如清洗数据、去除错误的数据等。 2. 数据可视化: 包括各种类型的图表和地图展示,比如条形图、饼图和地图可视化等。 3. 机器学习:在Python 中使用机器学习模型进行预测和分类,比如逻辑回归、朴素贝叶斯分类器和决策树等。 4. 深度学习:使用深度学习技术处理大量的数据,比如使用神经网络进行图像识别、自然语言处理和语音识别等任务。 总之,Python数据分析实例源码可以帮助学习Python的数据科学家更快速地进行数据分析和应用,促进了Python数据分析领域的广泛应用。 ### 回答2: Python数据分析实例源码提供了丰富的数据分析案例及源代码,并可以通过学习这些实例更好地理解Python数据分析领域的应用。这些实例涉及到的领域包括数据预处理、数据可视化及机器学习等,并可以帮助您更好地处理和分析数据。 其中包括常用的数据处理和分析库,如Pandas和Numpy,它们可以帮助您处理和操作数据集。同时也包括了可视化库,如Matplotlib和Seaborn。这些库可以帮助您更好地理解数据集的分布和相关性,以便更好地进行数据探索和分析。 Python数据分析实例源码还包括一些机器学习相关的案例,如监督学习、无监督学习、深度学习等。它们可以帮助您了解如何使用Python在机器学习领域应用最新技术。 通过Python数据分析实例源码的学习,您可以更好地了解Python数据分析领域的应用,并且可以通过实例代码更加深入的理解Python的使用方法。这些实例不仅可以帮助您在处理数据时更加得心应手,还可以帮助您在解决实际问题时更加有效地使用Python。 ### 回答3: Python数据分析实例源码是指用Python编写的代码,用于解决数据分析中的问题或实现数据分析算法。这类源码通常包括数据读取、数据预处理、数据分析和可视化等功能,在实现数据分析的整个过程中发挥着重要的作用。 对于数据读取和预处理,Python提供了强大的Pandas库来处理常见的数据类型,例如CSV格式、Excel格式、JSON格式等,并且Pandas库支持基本的数据清洗、处理缺失值、数据变换等功能。而对于数据分析和可视化,Python则提供了Numpy、Matplotlib、Seaborn等库,这些库可以帮助我们进行统计分析和数据可视化,并且具有很高的灵活性和扩展性,可以满足不同场景下的数据分析需求。 以一个简单的数据分析实例为例,给定一份学生成绩的CSV文件,我们希望分析每个学生各科成绩的平均分、标准差等统计指标,并且绘制出每个学生的成绩分布图。以下是Python数据分析实例的源码: ```python import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 读取数据 df = pd.read_csv('scores.csv') # 计算各科平均分和标准差 df['mean'] = df.mean(axis=1) df['std'] = df.std(axis=1) # 绘制成绩分布图 for col in df.columns[:-2]: sns.displot(df, x=col, hue='name', kind='kde') plt.title('Distribution of %s' % col) plt.savefig('%s.png' % col, dpi=300) plt.show() ``` 该源码中,我们首先使用Pandas的read_csv函数读取CSV文件,并对数据进行预处理,计算各科平均分和标准差,并将计算结果保存在DataFrame中。然后,我们使用Seaborn库绘制出各科成绩的分布图,并通过循环批量保存成绩分布图像。最后,我们通过Matplotlib库展示图像。 总之,Python数据分析实例源码对于从事数据分析工作的人来说是非常重要的工具之一,可以帮助分析师更高效更快捷地解决实际问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值