机器学习
Leonardo Liu
这个作者很懒,什么都没留下…
展开
-
机器学习算法程序库——Scikit-Learn简介:特征工程
本博客所有内容均整理自《Python数据科学手册》,欢迎讨论交流~对于机器学习实例,我们很多时候都是直接假设数据集已经是一个干净的 ,即数据集是一个[n_samples, n_features]的特征矩阵。但是在现实生活和工作中,数据几乎不可能如此干净,因此,我们需要在获取数据之后,对这些数据进行转换,尽力转换成特征矩阵的数值。这个过程一般被称为特征工程。接下来,我们就首先介绍一些特征...原创 2019-01-18 20:58:49 · 371 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter07
Q1. If you have trained five different models on the exact same training data, and they all achieve 95% precision, is there any chance that you can combine these models to get better results? If so, h...原创 2019-03-22 19:37:55 · 380 阅读 · 0 评论 -
Kaggle Titanic Challenges 生存预测 数据预处理 模型训练 交叉验证 步骤详细解析
本博客所有内容均整理自《Hands-On Machine Learning with Scikit-Learn & TensorFlow》一书及其GitHub源码。看《Hands-On》一书至第三章,习题里面后两题是实际操作的编程题,自己初步动手效果不错,特此记录一下。运行环境:Jupyter Notebook 语言:Python3.6.40、题目描述Kaggle的Tita...原创 2019-03-18 22:46:04 · 2151 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter03
Q1. Try to build a classifier for the MNIST dataset that achieves over 97% accuracy on the test set. Hint: the KNeighborsClassifier works quite well for this task; you just need to find good hyperpara...原创 2019-03-19 22:02:57 · 977 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter06
Q1. What is the approximate deph of a Decision Tree trained (without restrictions) on a training set with 1 million instances?A1: The depth of a well-balanced binary tree containing m leaves is equa...原创 2019-03-21 22:16:23 · 307 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter05
Q1. What is the fundamental idea behind Support Vector Machines?A1: The fundamental idea of SVM is to maximize the margin between the decision boundaries and separate the training instances into two...原创 2019-03-21 15:57:03 · 413 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter01
Q1. How would you define Machine Learning?A1: The science to programming computers to learn from data.Q2. Can you name four types of problems where it shines?A2: Predict the weather; segment ...原创 2019-03-12 16:30:15 · 244 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter04
Q1. What Linear Regression training algorithm can you use if you have a training set with millions of features?A1:Stochastic Gradient Descentor Mini-Batch Gradient Descent.Q2. Suppose the feat...原创 2019-03-20 22:35:53 · 504 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter02
For some unknown reason, my computer's Scikit-Learn package cannot deal with theColumnTransformer function, so I never succeed in getting the housing_prepared data, thus the following answer is offic...原创 2019-03-15 19:19:31 · 457 阅读 · 0 评论 -
机器学习工程实例 垃圾邮件过滤系统 数据预处理 训练模型 交叉验证 精准率召回率计算 步骤详细解析
本博客所有内容均整理自《Hands-On Machine Learning with Scikit-Learn & TensorFlow》一书及其GitHub源码。看《Hands-On》一书至第三章,习题里面后两题是实际操作的编程题,自己初步动手效果不错,特此记录一下。运行环境:Jupyter Notebook 语言:Python3.6.40、题目描述总体目标:创建一个垃圾...原创 2019-03-19 22:01:24 · 4613 阅读 · 0 评论 -
机器学习算法程序库——Scikit-Learn简介:模型验证和模型选择
本博客所有内容均整理自《Python数据科学手册》,欢迎讨论交流~Scikit-Learn评估器API的基本步骤为如下五步:从Scikit-Learn中导入适当的评估器类,选择模型类 用合适的数值对模型类进行实例化,配置模型超参数 整理数据,获取特征矩阵和目标数组 调用模型实例的fit()方法对数据进行拟合 对新数据应用模型:在监督学习模型中,通常使用predict()方法预测新...原创 2019-01-16 16:25:14 · 741 阅读 · 0 评论 -
机器学习算法程序库——Scikit-Learn简介:数据表和评估器API
本博客所有内容均整理自《Python数据科学手册》,欢迎讨论交流~目前,Python有很多实现机器学习算法的程序库,其中,Scikit-Learn是最流行的之一,它为各种常用的机器学习算法提供了高效版本。Scikit-Learn的主要优点有干净、统一、管道命令式的API、在线文档实用且完整等。PS:本博客使用的编程语言均为Python,给出的图片均为在Jupyter Notebook上运行...原创 2019-01-15 20:49:15 · 409 阅读 · 0 评论 -
机器学习基本概念和分类 数据科学角度
本博客所有内容均整理自《Python数据科学手册》,欢迎讨论交流~当下“机器学习”这个术语非常流行,而且当机器真的学习起来之后,能力也确实非常强悍,击败人类围棋世界冠军只能算是机器学习起来之后的一个“小目标”。众所周知,机器学习是人工智能领域不可忽视的力量,然而,虽然对机器学习的研究基本源自人工智能领域,但是机器学习的方法却可以应用于千千万万的广大范畴,无论是无人驾驶还是互联网金融,都有机器学...原创 2019-01-15 15:11:24 · 455 阅读 · 1 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter08
Q1. What are the main motivations for reducing a dataset's dimensionality? What are the main drawbacks?A1: Motivations:To speed up a subsequent training algorithm. To visualize the data and ga...原创 2019-03-22 20:43:30 · 458 阅读 · 0 评论