Python数据分析专栏
一个初学者记录Python数据分析学习历程,方便自己回顾,同时希望与你共同进步
Narutolxy
在代码的梦境中,智慧凝聚成诗篇,每一行都镌刻着时间的印记,超越年龄的界限。穿越职场的风云变幻,我依旧保持着对编程的挚爱,如璀璨星辰,在夜空中闪耀不息。人工智能的浪潮为我揭开了新知的大门,赋予我翱翔技术天际的翅膀。在它的赋能下,我信心倍增,新知如潺潺流水迅速汇入我的智慧之海,激励着我在探索的道路上奋勇前行。我怀揣梦想,矢志不渝,深信只要持之以恒地追求,便能越过一切阻碍,抵达心中的远方。让我以经历为墨,以时间为纸,细细描绘编程的绚烂世界。编程不仅是一门精湛的技艺,更是一种生活的艺术,是我对未来充满憧憬与热爱的最好诠释。与君共勉,共同追寻未来的无限可能。
展开
-
seaborn第一次作业20200921
需求描述如上数据有问题如下:• 索引无序• 单价中包含各种各样单位所以需求如下:• 读取数据 重置索引• 将单价列取出 整数 或 浮点数 并转为可计算类型• 将评分列进行降序• 直观体现评分数据主要分布在哪个区间• 直观体现单价与评分的分布• 取出评分前100条数据 直观体现不同出版社的出书次数相关文件内容代码实现#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/21 002121:33#@Au原创 2020-09-22 11:19:05 · 245 阅读 · 0 评论 -
pandas实战练习09
需求描述:通过直观的方式体现,从covid-19开始至今美国人对感染的担心程度严重还是对经济的担心程度严重• covid_concern_toplines.csv• subject:concern-infected 关心感染,concern-economy 关心经济• very_estimate:非常关注• somewhat_estimate:有些关注• not_very_estimate:不是非常关注• not_at_all_estimate:一点也不关注#!/user/bin/env p原创 2020-09-19 08:31:40 · 278 阅读 · 0 评论 -
pyecharts学习前期出现的问题20200919
pyecharts安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyecharts问题: pyecharts v1.9.0 版本功能预警#PendingDeprecationWarning: pyecharts 所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 ????#super().init(init_opts=init_opts)原因:‘’’所有图表类型将在 v1.9.0 版本开始强原创 2020-09-19 07:34:52 · 538 阅读 · 0 评论 -
Pandas实战练习03_20200915
实战3读取北上广深瓜子二手车的数据• 1.分别读取4个csv文件,然后合并多个csv文件• 2.去重复数据,重新设置连续索引• 3.汽车自动挡和手动挡,那么分别有多少辆• 4.哪个城市二手车数量最多• 5.获取深圳市最多的二手车品牌2:11:30未完待续...原创 2020-09-15 01:29:40 · 294 阅读 · 0 评论 -
Pandas实战练习02_20200914
读取 guazi.csv 二手车数据• 1.重命名列名(可以修改为中文(专业英语))• 2.异常值处理• 3.去除重复值• 4.年份,里程,售价,原价所在列的数据进行转换(数值型数据)• 5.缺失值的处理• 6.新增一列品牌数据...原创 2020-09-14 17:34:50 · 364 阅读 · 0 评论 -
Pandas实战练习01_20200914
实战1北上广深与沈阳5个城市空气质量数据,绘制出北京的PM2.5随时间的变化情况…/PM2.5/BeijingPM20100101_20151231.csv代码#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/14 10:03#@Author : GodSpeed#@File : Pandas实战02_01.py#@Software : PyCharmim原创 2020-09-14 14:35:25 · 329 阅读 · 0 评论 -
pandas第五次作业20200914修正版本
练习1通过starbucks_store_worldwide.csv数据,获取中国每个省份的分布数量代码实现#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/1115:49#@Author : GodSpeed#@File : pandas第五次作业01.py#@Software : PyCharmimport numpy as npimport pa原创 2020-09-11 16:47:54 · 184 阅读 · 0 评论 -
Pandas第四次作业20200910
练习1:将 学生成绩表 与 选修成绩表 进行水平的拼接目标:代码实现#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/1010:28#@Author : GodSpeed#@File : Pandas第四次作业.py#@Software : PyCharmimport pandas as pdimport numpy as np'''练习1原创 2020-09-10 10:48:50 · 208 阅读 · 0 评论 -
Pandas第三次作业20200907
练习1• 读取北向.csv 指定第一列为行索引• 查看数据的基本信息 有无缺失值 对其缺失值进行处理• 删除缺失值所在行• 查看数据的基本信息 查看数据是否清洗完毕• index列没啥用 将index列删除• 观察数据是否有重复行• 将重复行进行删除• 将行索引 进行升序• 将处理好的数据 保存至 北向(副).csv#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/719:53#@Author原创 2020-09-07 21:20:37 · 1736 阅读 · 0 评论 -
Pandas第二次作业20200904
练习1 读取 catNames2.csv 文件,完成需求如下:• 找到所有的使用次数超过800的猫的名字• 获取用次数最高的名字#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/414:55#@Author : GodSpeed#@File : Pandas第二次作业01.py#@Software : PyCharmimport pandas as pd原创 2020-09-04 17:14:41 · 993 阅读 · 0 评论 -
Python数据分析pandas第一次作业20200902
练习1 利用pandas创建Excel表格1.1 创建学生成绩表1通过 Pandas 创建 学生成绩表的 excel 文件 。参考数据如下(可自己构建)#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/9/2 000222:30#@Author : GodSpeed#@File : pandas第一次作业01.py#@Software : PyCharmimport pandas原创 2020-09-03 00:03:04 · 900 阅读 · 0 评论 -
numpy第五次作业修正版本20200830
以上为英国与美国Youtube数据,其每列对应的是:点击,喜欢,不喜欢,评论GB_video_data_numbers.csv US_video_data_numbers.csv练习1#结合Matplotlib绘制各自的评论数量的图形,体现其评论数主要分布在哪个区间。—直方图#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/8/28 22:23#@Author : GodSpeed#@File ..原创 2020-08-30 02:37:42 · 286 阅读 · 0 评论 -
numpy作业04_20200826
作业01在 files 文件夹下有多个文件,需要通过代码获取文件名称列表并且将文件数据进行 行堆叠 ,并保存到新的文件中。#!/user/bin/env python#-*-coding: utf-8-*-#@Time : 2020/8/268:45#@Author : GodSpeed#@File : 20200825课程代码.py#@Software : PyCharmimport numpy as npimpor原创 2020-08-26 23:03:48 · 305 阅读 · 0 评论 -
数据分析numpy作业03_2020082422
练习1:在讲解 Matplotlib 的时候,我们使用以下代码绘制分组条形图。其中讲解到,三根柱子的位置需要同时往左或往右移动时,需要使用到列表推导式。实际上,duck不必,请使用numpy的所学来优化我们该部分代码。import matplotlib.pyplot as pltimport numpy as npdef init_font(): plt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一(替换sans-serif字体)原创 2020-08-24 15:30:46 · 305 阅读 · 0 评论 -
python数据分析numpy第二次作业20200821
练习要求如下:• 创建 22 的数组arr1 元素自定义• 创建 223 的数组arr2 元素自定义• 查看arr2的维度以及形状• 将arr2转为1维• 将arr1进行转置• 生成 44 全为1的数组 arr3• 生成 单位矩阵matplotlib读取图片...原创 2020-08-21 16:38:34 · 302 阅读 · 0 评论 -
python数据分析Numpy小记2020
Numpy介绍NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:提供高效多维数组提供了基于数组的便捷算术操作以及广播机制对数据进行快速的矩阵计算对硬盘中数组数据进行读写操作Numpy安装pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple/Nu原创 2020-08-21 14:28:19 · 157 阅读 · 0 评论 -
第四节作业csv与xlxs文件读写20200820
练习1:读取餐饮csv文件的数据文件: 餐饮.csv方式1:用csv进行读写操作#方式1:用csv进行读写操作import csv#利用csv模块使用---读文件并把内容返回为二维码列表中def read_csvfile_csvM(filename): lists_data = [] with open(filename,'r',encoding='gbk') as f_r: data_iterator = csv.reader(f_r) f原创 2020-08-20 13:18:45 · 387 阅读 · 0 评论 -
202008数据分析作业2
练习1绘制班级的身高分布图形 height = [160,163,175,180,176,177,168,189,188,177,174,170,173,181]from matplotlib import pyplot as pltimport randomimport numpy as npplt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一(替换sans-serif字体)plt.rcParams['axes.unicode_minus'] =原创 2020-08-17 17:23:23 · 407 阅读 · 1 评论 -
数据分析202008第3节课Matplotlib作业
练习1为了对某一产品进行合理定价,我们对此类商品进行了试销实验,价格与需求量数据如下。利用图表分析规律。price = [60,80,40,30,70,90,95]sales = [100,50,120,135,65,45,40]原创 2020-08-15 05:45:20 · 289 阅读 · 0 评论 -
python数据分析学习初探
python数据分析工具Jupyter notebookJupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。安装jupyter notebook朱皮特安装Jupyter Notebook的前提是需要安装了Python(3.3版本及以上,或2.7版本)pip3 install jupyter运行jupyter notebook首先进入工作路径,后终端输入命令jupyter notebook运行命令后,自动打开网原创 2020-08-13 23:27:55 · 287 阅读 · 0 评论