- 博客(3)
- 收藏
- 关注
原创 《机器学习实战》整理--分类算法(1)
12月中旬到1月下旬,花了一个半月的时间,终于将《机器学习实战》这本书配合《cs229》课程学完了。现将这本书的主要内容线整理如下。每看一本书,我会很仔细看书的第一章,相当于论文的introduction部分,会介绍这本书主要讲了些什么,以及书的组成逻辑是什么。从这本的第一章《机器学习基础》中可以了解到,机器学习横跨计算机科学、工程技术和统计学等多个学科,需要多学科的专业知识。机器学习就是把无...
2018-01-30 15:33:43 1480
原创 泰坦尼克获救分析--根据寒小阳博客整理
第一次学习如何完成一个机器学习的整体工程,借鉴的是寒小阳关于kaggle上的一个新手初级赛题--泰坦尼克沉船事件。原文链接戳泰坦尼克沉船事件分析--logistic回归。文章中博主提到: 『对数据的认识太重要了!』 『数据中的特殊点/离群点的分析和处理太重要了!』 『特征工程(feature engineering)太重要了!在很多Kaggle的场景下,甚至比model本身还要重要...
2018-01-19 16:39:56 1948
原创 python中的数据结构整理
python自带的数据结构有:list,tuple,dict,str.加上array模块。list在保存时,同时保存了指针及对象,这样比较消耗内存。而array对象和列表不同,它直接保存数值,但只是一维的。numpy包含的数据结构有:ndarray和matrixndarray是多元数组,可以是1D,2D,3D...,创建形式是numpy.array()matrix是矩阵,必须是二维的,且...
2018-01-18 15:30:52 285
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人