Python
Leonardo Liu
这个作者很懒,什么都没留下…
展开
-
Windows10系统 给Python 3.X 安装basemap地图包
1. 基本背景matplotlib里有一个basemap包,是一个2D数据库,专门用于绘制地图有关的图片,性能非常强大。但是,basemap的官方安装包目前下载到的只能适用于Python3.2版本,如果你是3.6版本的,就会出现以下错误:Python version 3.2 required, which was not found in the registry.在这种情况下,我...原创 2019-01-24 15:33:53 · 994 阅读 · 0 评论 -
机器学习工程实例 垃圾邮件过滤系统 数据预处理 训练模型 交叉验证 精准率召回率计算 步骤详细解析
本博客所有内容均整理自《Hands-On Machine Learning with Scikit-Learn & TensorFlow》一书及其GitHub源码。看《Hands-On》一书至第三章,习题里面后两题是实际操作的编程题,自己初步动手效果不错,特此记录一下。运行环境:Jupyter Notebook 语言:Python3.6.40、题目描述总体目标:创建一个垃圾...原创 2019-03-19 22:01:24 · 4580 阅读 · 0 评论 -
Pycharm无法用pip安装PIL以及安装Pillow之后依然报错“No module named 'Pillow'”的诡异问题
首先声明,本人遇到的Pycharm无法用pip安装PIL的问题和安装Pillow模块之后依然报错“No module named 'Pillow'”问题最终都得到了解决,相信很多人也遇到过,但由于系统,软件版本,运行环境等一系列问题,可能本博客的解决办法并不完全普适,但文章的最后,我总结了两种纠错方法,希望能帮助大家解决问题。很多学习Python的同学们肯定都遇到过一个名叫PIL的模块,扩展开...原创 2019-03-07 22:17:30 · 31501 阅读 · 33 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter02
For some unknown reason, my computer's Scikit-Learn package cannot deal with theColumnTransformer function, so I never succeed in getting the housing_prepared data, thus the following answer is offic...原创 2019-03-15 19:19:31 · 431 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter04
Q1. What Linear Regression training algorithm can you use if you have a training set with millions of features?A1:Stochastic Gradient Descentor Mini-Batch Gradient Descent.Q2. Suppose the feat...原创 2019-03-20 22:35:53 · 469 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter05
Q1. What is the fundamental idea behind Support Vector Machines?A1: The fundamental idea of SVM is to maximize the margin between the decision boundaries and separate the training instances into two...原创 2019-03-21 15:57:03 · 387 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter06
Q1. What is the approximate deph of a Decision Tree trained (without restrictions) on a training set with 1 million instances?A1: The depth of a well-balanced binary tree containing m leaves is equa...原创 2019-03-21 22:16:23 · 280 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter03
Q1. Try to build a classifier for the MNIST dataset that achieves over 97% accuracy on the test set. Hint: the KNeighborsClassifier works quite well for this task; you just need to find good hyperpara...原创 2019-03-19 22:02:57 · 954 阅读 · 0 评论 -
Kaggle Titanic Challenges 生存预测 数据预处理 模型训练 交叉验证 步骤详细解析
本博客所有内容均整理自《Hands-On Machine Learning with Scikit-Learn & TensorFlow》一书及其GitHub源码。看《Hands-On》一书至第三章,习题里面后两题是实际操作的编程题,自己初步动手效果不错,特此记录一下。运行环境:Jupyter Notebook 语言:Python3.6.40、题目描述Kaggle的Tita...原创 2019-03-18 22:46:04 · 2120 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter07
Q1. If you have trained five different models on the exact same training data, and they all achieve 95% precision, is there any chance that you can combine these models to get better results? If so, h...原创 2019-03-22 19:37:55 · 357 阅读 · 0 评论 -
算法基础:散列表(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~想必大家都熟知最基本的两个数据结构:数组和链表,在此二者的基础上,延伸出了两种比较高级的数据结构:栈和队列。其实还有一种很有用的基本数据结构,那就是散列表。1、散列表的基本概念散列表也成为哈希表,是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映...原创 2019-02-26 22:35:13 · 467 阅读 · 0 评论 -
算法基础:NP完全问题
本博客所有内容均整理自《算法图解》,欢迎讨论交流~相信稍微做过一点学术研究的都不会对“NP完全问题”这个概念感到陌生。它是千禧难题之首。对于NP完全问题的定义,百度百科是这样给出的:NP完全问题(NP-C问题),是世界七大数学难题之一。 NP的英文全称是Non-deterministic Polynomial的问题,即多项式复杂程度的非确定性问题。简单的写法是 NP=P?,问题就在这个问号...原创 2019-03-05 16:57:37 · 48824 阅读 · 0 评论 -
Python画图 %matplotlib inline语句的使用和作用
今天想使用Python的matplotlib包来画图,按照记忆中的步骤来,敲了如下代码:%matplotlibimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snssns.set()rng = np.random.RandomState(1)X = np.dot(rng.rand(2, 2), ...原创 2019-01-21 14:55:57 · 47601 阅读 · 8 评论 -
算法基础:递归(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~相信大家对递归这个名词都不陌生,递归是一种非常优雅的编程思路和问题解决方法。具体来说,程序调用自身的编程技巧称为递归( recursion)。递归做为一种算法在各种程序设计语言中广泛应用。 一个过程或函数在其定义或说明中有直接或间接调用自身的一种方法,它通常把一个大型复杂的问题层层转化为一个与原问题相似的规模较小的问题来求解,递归策略只需少...原创 2019-02-21 21:17:41 · 464 阅读 · 1 评论 -
算法基础:分治法(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~有时候,你可能会遇到使用任何已知的算法都无法解决的问题,这种时候,我们就可以试试分治法的思路。分治法的基本思想很简单,顾名思义,就是将一个大问题分解为若干个子问题,然后我们逐一地解决这些子问题,将所有子问题解决完毕,也就将整体的大问题解决完毕了。分治法的精髓:分--将问题分解为规模更小的子问题;治--将这些规模更小的子问题逐个击...原创 2019-02-21 21:49:16 · 2913 阅读 · 3 评论 -
算法基础:快速排序(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~快速排序是一种常用的排序算法,比选择排序快很多。C语言标准库中的函数qsort实现的就是快速排序。快速排序非常实用,它使用了递归和分治法的思想。具体来说,快速排序的思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,...原创 2019-02-22 17:32:34 · 237 阅读 · 0 评论 -
算法基础:图算法和广度优先搜索(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~谈到图算法和广度优先搜索,我认为首先要明白这两种算法是用来干嘛的。在这里我引用《算法图解》一书举的一个很经典的例子来讲解。很多时候我们希望能够找出两样东西之间的最短距离,这里的距离不是单单是相距多少米,有很多含义。我们来看看以下几个问题:编写国际跳棋AI,计算最少走多少步就可获胜; 编写拼写检查器,计算最少编辑多少个地方就可将错拼的单...原创 2019-02-27 22:30:39 · 4345 阅读 · 2 评论 -
算法基础:贪婪算法(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~相信大家都或多或少地听说或者接触过贪婪算法,当我们遇到一个没有办法解决的问题时,贪婪算法总是一个现成的好思路。对于贪婪算法的定义,百度百科是这样说的:贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。其实说白了,就是在当前状态下找到局...原创 2019-03-04 22:46:51 · 2848 阅读 · 0 评论 -
算法基础:狄克斯特拉算法(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~之前在引入图算法和广度优先搜索的时候,我举了一个旅行最短距离的例子,其实在那一节,广度优先搜索并没有解决那个例子的问题,在这里使用狄克斯特拉算法才可以真正解决赋权图的最短距离问题。我们依然沿用那个例子。假设你要从北京到成都去旅游,但是已经买不到北京直达成都的火车票或者飞机票了,于是你决定中转。现在有以下几种中转方案:1、北京-乌鲁木...原创 2019-03-01 21:02:37 · 489 阅读 · 0 评论 -
算法基础:二分查找 (基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。如果要查找的元素包含在输入的元素列表内,则返回其位置。具体来说,以报数为例子,假设随便想一个1~100的数字,如65,让你来猜,二分查找的思想就是每次都猜最中间的那个数字。所以第一次你猜...原创 2019-02-20 18:37:49 · 749 阅读 · 0 评论 -
算法基础:选择排序(基于Python)
本博客所有内容均整理自《算法图解》,欢迎讨论交流~选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理是每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到全部待排序的数据元素排完。举个例子,我有以下8个数字,要从小到大进行排序:33, 12, ...原创 2019-02-20 19:57:30 · 180 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn & TensorFlow Exercise Q&A Chapter08
Q1. What are the main motivations for reducing a dataset's dimensionality? What are the main drawbacks?A1: Motivations:To speed up a subsequent training algorithm. To visualize the data and ga...原创 2019-03-22 20:43:30 · 431 阅读 · 0 评论