自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 2021-06-24

Task5 动手学数据分析一、分析库的作用import matplotlib.pyplot as pltimport seaborn as snsfrom IPython.display import Image对于matplotlib库与seaborn库的比较,Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 它也可以和图形工具包一起使用,如 PyQt 和 wxPython可以做一个根据花的种类定义好每种花的颜色的

2021-06-24 02:28:02 176

原创 2021-06-22

Task4 数据可视化一、柱状图可视化男女存活人数,女性存活人数更多,且存活率高;sex = text.groupby('Sex')['Survived'].sum()sex.plot.bar()plt.title('survived_count')plt.show()二、折线图可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况对于这种统计性质的且用折线表示的数据,你可以考虑将数据排序或者不排序来分别表示fare_sur = text.groupby(['Fare'])['

2021-06-22 01:02:27 75

原创 2021-06-19

动手学数据分析Task3一、今天学习了使用concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上边的result_up和result_down纵向合并为result。答:红色横线标记的地方是一个拼接时很好用的一个参数,相当于reset_index()的操作。二、Q:对比merge、join以及concat的方法的不同以及相同。思考一下在任务四和任务五的情况下,为什么都要求使用DataFrame的app

2021-06-20 00:28:25 100

原创 2021-06-17

动手学数据分析第二章 数据清洗及特征处理一、数据清洗的原因:我们拿到的原始数据由于统计方法或者统计过程出现的纰漏通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,第二章通过学习缺失值、重复值、字符串和数据转换等操作,实现将数据清洗成可以分析或建模的数据的功能。二、观察与发现既然要处理数据中的异常点,首先就得找到异常点,第一步,dateframe.info()函数用于获取DateFrame的简要摘要,方

2021-06-17 22:51:31 110

原创 2021-06-16

动手学数据分析个人对数据挖掘比较感兴趣,所以本次跟随Datawhale组织的动手学数据分析组队活动,入手数据分析,希望能有所收获。本文主要记录一些学习上的重点一、读取数据:知道数据加载的方法后,试试pd.read_csv()和pd.read_table()的不同,如果想让他们效果一样,需要怎么做?了解一下’.tsv’和’.csv’的不同,如何加载这两个数据集?要想效果相同,将read_table的分隔符参数sep改为‘,’。read_table将范式的分隔符分隔值的文件读入DataFrame,默认为

2021-06-16 00:58:48 186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除