先前在天善智能那儿得到了一些翻译版的DataCamp,于是也抽空过一遍内容,把一些觉得常用的内容给记录下来,主要围绕着建模相关的资料内容,所以主要还是Pandas、Numpy、Scikit-learn为主了。
(Scikit-learn内容截图)
数据导入
数据导入还是比较常用的,这里整理一些常见的数据格式的导入语句,方便日后查阅,但为了含括更多内容,不会对一些特殊数据内容进行展开,不过其实大家也可以通过关键字去查看官方文档会更加地详细。
文本文件
主要分为了纯文本文件和表格文件。
1)纯文本文件
1filename = 'xxx.text'
2file = open(filename,mode='r')
3text = file.read()
4print(file.closed)
5file.close()
6print(text)
7# 以只读方式读取文件,查看文件是否已经关闭,关闭文件
8# open的mode方式还有很多,见 https://blog.csdn.net/pengyangyan/article/details/79966297
2)表格文件
Sam:微信公众号贴代码真得非常麻烦,所以我还是把代码展示用GitHub来share给大家吧,直接点击【阅读原文】就好了呢。???