关于泰坦尼克预测生还案例的学习
先分享下的数据文件:百度网盘链接:http://pan.baidu.com/s/1i4OtRaX 密码:rqcx
导入数据
引入了os,第一次见
https://www.cnblogs.com/kaituorensheng/archive/2013/03/18/2965766.html
python编程时,经常和文件、目录打交道,这是就离不了os模块。os模块包含普遍的操作系统功能,与具体的平台无关。以下列举常用的命令
os.name——判断现在正在实用的平台,Windows 返回 ‘nt’; Linux 返回’posix’
os.getcwd()——得到当前工作的目录。
os.listdir()——指定所有目录下所有的文件和目录名。例:
以列表的形式全部列举出来,其中没有区分目录和文件。
os.remove()——删除指定文件
os.rmdir()——删除指定目录
os.mkdir()——创建目录
注意:这样只能建立一层,要想递归建立可用:os.makedirs()
os.path.isfile()——判断指定对象是否为文件。是返回True,否则False
os.path.isdir()——判断指定对象是否为目录。是True,否则False。例: 9. os.path.exists()——检验指定的对象是否存在。是True,否则False.例:
os.path.split()——返回路径的目录和文件名。例:
此处只是把前后两部分分开而已。就是找最后一个’/’。看例子:
os.getcwd()——获得当前工作的目录(get current work dir)
os.system()——执行shell命令。
自己练习的代码如下:
In[1] import os
In[2] os.name
Out[2] 'nt'
In[3] os.getcwd()
Out[3] 'C:\\Users\\Administrator'
In[4] os.listdir()
In[5] os.remove("Untitled7.ipynb")
In[6] os.path.exists("Untitled7.ipynb")
Out[6] False
In[2] os.path.split("Untitled8.ipynb")
Out[7] ('', 'Untitled8.ipynb')
fig = plt.figure(figsize=(10,10))
fig.set(alpha=0.5)
plt.subplot2grid((2,3),(0,0))
data.Survived.value_counts().plot(kind='bar')
plt.title("获救情况(1为获救)")
plt.ylabel("人数")
plt.subplot2grid((2,3),(0,1))
data.Pclass.value_counts().plot(kind='bar')
plt.title("乘客等级分布")
plt.ylabel("人数")
plt.subplot2grid((2,3),(0,2))
plt.scatter(data.Survived,data.Age)
plt.grid(b=True, which='major',axis='y')
plt.title("按年龄看获救分布(1为获救)")
plt.ylabel("年龄")
plt.subplot2grid((2,3),(1,0))
data.Age[data.Pclass==1].plot(kind='kde')
data.Age[data.Pclass==2].plot(kind='kde')
data.Age[data.Pclass==3].plot(kind='kde')
plt.xlabel("年龄")
plt.ylabel("密度")
plt.title("各等级的乘客年龄分布")
plt.legend(('1等舱','2等舱','3等舱'),loc='best')
plt.subplot2grid((2,3),(1,2))
data.Embarked.value_counts().plot(kind='bar')
plt.title("各登船口上船人数")
plt.ylabel("人数")
plt.show()