数据分析篇
jiao1107
这个作者很懒,什么都没留下…
展开
-
matplotlib怎么解决中文不显示的问题?
在使用matplotlib绘图时,经常会用到中文给图表添加描述,在不加处理的情况下,matplotlib里面的字体是不支持显示中文的,显示的是一堆乱码(方框?),怎么解决这个问题?只需要几行代码! import matplotlib my_font = matplotlib.font_manager.FontProperties(fname = './msyhbd.ttf') ...原创 2019-07-17 16:23:44 · 1002 阅读 · 0 评论 -
Pandas数据结构Series,DataFrame简介
Series简介 Series是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及椅子与之相关的数据标签(索引)组成。Series的字符串表现形式为:索引在左边,值在右边。没有为数据指定索引时,为自动创建一个0到N-1的整数型索引。可以通过Series的values和index属性获取其数组表现形式和索引对象。 Series的创建 obj = pd.Series([9, 3, 9...原创 2019-07-24 16:18:26 · 220 阅读 · 0 评论 -
数据分析案例:泰坦尼克号上的船员是否获救预测
整体流程 1.数据读取 2.特征理解分析 3.数据清洗与预处理 4.建立模型 准备工作 第一步:理解数据,分析每个字段的意思 PassengerID 乘客唯一编号(无关) Pclass 船舱等级 Survived 是否获救 Sex 二值属性(female、male) SibSp 一起上船的兄弟姐妹的个数 Parch 一起上船的老人和孩子的数量 Ticket 船票的编号(...原创 2019-07-21 11:15:02 · 1097 阅读 · 0 评论