![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 77
huanlin12
这个作者很懒,什么都没留下…
展开
-
数据科学工程师面试宝典系列之一--Python爬虫实战
1.数据抽取、转换、储存(Data ETL--extract/transfer/loading): 原始资料【raw data】==》ETL脚本【ETL Script】==》结构化数据【Tidy Data】 2.网络爬虫:将非结构化的网页数据转成结构化信息 3.网络爬虫架构: =======》请求 数据中心《==资料剖析《==网页链接器(Web Connector) 网页 《====原创 2017-02-08 16:23:13 · 947 阅读 · 0 评论 -
数据科学工程师面试宝典系列之二---Python机器学习kaggle案例:泰坦尼克号船员获救预测
1.Python机器学习kaggle案例 Numpy-python科学计算库;Pandas-python数据分析处理库;Scikit-learn-python机器学习库; 2.泰坦尼克号数据介绍 乘客编号、是否幸存、等级、姓名、性别、年龄、兄弟姐妹个数、带老人孩子个数、船票、船票价格、上船地点; 3.数据预处理 import pandas #ipython notebook titan原创 2017-02-08 21:54:31 · 5169 阅读 · 2 评论