自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 玩转算法面试LeetCode算法练习——队列(二叉树层序遍历+BFS和图最短路径)

2.队列          队列与栈类似,差别仅在于向队列里添加元素时,元素被加到尾部(入队),而提取元素时则从队列头部开始(出队)。这种机制称作FIFO(first in, first out,先进先出);而栈则被称作LIFO(last in, first out,后进先出)。       ...

2018-07-19 12:33:54 206 0

转载 吴恩达机器学习笔记(week6——)

http://ai-start.com/ml2014/html/week6.htmlWeek6十、应用机器学习的建议(Advice for Applying Machine Learning)10.1 决定下一步做什么10.2 评估一个假设10.3 模型选择和交叉验证集10.4 诊断偏差和方差10...

2018-06-01 23:16:56 337 0

原创 玩转算法面试LeetCode算法练习——查找问题2

目录   使用查找表的经典问题 1. 两数之和 15. 三数之和 18. 四数之和 16. 最接近的三数之和(不完全属于查找表) 454. 四数相加 II 49. 字母异位词分组 447. 回旋镖的数量 149. 直线上最多的点数 使用查找表的经典问题 1. 两数之和 给...

2018-05-31 11:08:29 391 0

原创 算法复杂度分析

1.时间复杂度:什么是Big O:O(f(n))表示运行算法所需要执行的指令数,和f(n)成正比。n表示数据规模例:随着输入规模n的增大,时间复杂度的增长模式2.数据规模概念:该时间针对的是简单的求和运算,针对算法在该基础上大约除10即可3.空间复杂度:递归的深度是多少,空间复杂度就是多少4.常见...

2018-05-25 11:30:57 1148 0

转载 用 Python 统计高频字数

转载自http://blog.csdn.net/cxsydjn/article/details/70991846问题(来自Udacity机器学习工程师纳米学位预览课程)用 Python 实现函数 count_words(),该函数输入字符串 s 和数字 n,返回 s 中 n 个出现频率最高的单词。...

2018-05-10 10:15:18 696 0

原创 Udacity机器学习入门——交叉验证(cross-validation)

测试数据可以让你评估你的分类器或回归在独立数据集上的性能,还能帮助你避免过度拟合在sklearn中训练/测试分离sklearn链接:http://scikit-learn.org/stable/modules/cross_validation.html加载数据集以适应线性SVM:from skle...

2018-05-09 19:41:13 876 0

原创 Udacity机器学习入门——主成分分析PCA

以下数据是一维还是二维练习1:通过PCA找到新坐标系的中心(2,3),△x=1,沿坐标系x’向右移,则△y=1;△y=1,沿坐标系y’向上移,则△x=-1向量长度√2,按原坐标系计算练习2:通过PCA找到新坐标系的中心(3,3),△y=-1,沿坐标系x’移动,则△x=2;△x=1沿坐标系y’移动,...

2018-05-09 11:09:26 552 0

原创 Udacity机器学习入门——特征选择

练习:一个新的安然特征练习poi_flag_emal.py if from_emails: ctr=0 while not from_poi and ctr < len(from_emails): if from_emai...

2018-05-07 17:47:21 470 0

原创 Udacity机器学习入门——文本学习

文本学习的基本问题与输入特征相关,我们学习的每个文件、每封邮件或每个书名,它的长度都是不标准的,所以不能讲某个单独的词作为输入特征,因此在文本的机器学习中有个功能——词袋Bag of Words,基本理念选定一个文本,然后计算文本的频率Nice Day与A Very Nice Day       ...

2018-05-03 21:42:13 472 1

原创 Udacity机器学习入门——特征缩放

Chirs体重+身高=146.1 Caneron体重+身高=180.9 Serah 体重+身高=120.2                  从数据上看Chirs与S数值更接近,应该穿S大小衣服,但是由于体重和身高的度量标准差异(一个是个位数,一个是百位数)导致体重占据了主导位置,此时就用到特征缩...

2018-04-26 23:48:21 226 0

原创 Udacity机器学习入门——聚类Clustering

非监督学习:聚类、降维聚类:K-means1.随意画出聚类中心2.分配3.优化连接集群中心,画等距垂直于两集群连线的线优化:移动中心再分配,再优化········直至两个类的正确中心位置很有意思的k-means可视化工具 http://www.naftaliharris.com/blog/visu...

2018-04-23 23:36:05 519 0

原创 Udacity机器学习入门——异常值outlier

什么可能导致异常值:根据具体事件选择忽略还是重视(欺诈侦测)传感器故障、(忽略)数据输入错误、(忽略)外部数据×反常事件(通常需要重视)选择异常值异常值检测-删除算法训练异常值检测——找出训练集中访问最多的点,去除这些点(一般约10%的异常数据)再训练 (可能需要重复2、3步骤多次)删除前:删除后...

2018-04-23 19:01:41 1395 2

原创 LeetCode初级算法练习——字符串

344. 反转字符串请编写一个函数,其功能是将输入的字符串反转过来。示例:输入:s = "hello" 返回:"olleh"class Solution: def reverseString(self, s): ""...

2018-04-20 00:02:10 207 0

原创 Udacity机器学习入门——回归

连续监督学习连续分类器与离散分类器连续通常是有序的(如年龄,收入(10000和9999是没差的))离散通常是无序的(如入职id(两个人之间不存在任何关系)、天气(晴天或雨天)、根据姓名查找电话号码(连续号码是不存在任何关系的))PS:视为离散的多数事物在某种程度上是连续的(如把天气表示为在某个时间...

2018-04-19 20:20:48 225 1

原创 Udacity机器学习入门笔记——数据集与问题

    MORE DATA>FINE-TUNED ALGORITHM    更多的数据集要比经过精密调整的算法可以提供更好的结果,使用更多的数据几乎总能帮助算法取得更好的效果数据类型:值数据:基本特征就是数值(薪水信息)分类数据(categorical):类别变量,监督分类较多,包括...

2018-04-13 15:20:43 246 0

原创 Python访问数据库

SQLite3表是数据库中存放关系数据的集合,一个数据库里面通常都包含多个表,表和表之间通过外键关联。要操作关系数据库,首先需要连接到数据库,一个数据库连接称为Connection;连接到数据库后,需要打开游标,称之为Cursor,通过Cursor执行SQL语句,然后,获得执行结果。Python定...

2018-04-12 20:57:29 161 0

原创 Python电子邮件

发邮件流程:假设我们自己的电子邮件地址是me@163.com    电子邮件软件被称为MUA:Mail User Agent——邮件用户代理。(Outlook或者Foxmail之类的软件)    Email从MUA发出去,不是直接到达对方电脑,而是发到MTA:Mail Transfer Agent...

2018-04-12 16:25:46 136 0

原创 Python网络编程TCP/UDP

TCP/IP简介    互联网协议包含了上百种协议标准,但是最重要的两个协议是TCP和IP协议,所以,大家把互联网的协议简称TCP/IP协议。    通信的时候,双方必须知道对方的标识,好比发邮件必须知道对方的邮件地址。互联网上每个计算机的唯一标识就是IP地址,类似123.123.123.123。...

2018-04-12 16:00:11 145 0

原创 virtualenv创建隔离python运行环境

    在开发Python应用程序的时候,系统安装的Python3只有一个版本:3.6。所有第三方的包都会被pip安装到Python3的site-packages目录下。    如果我们要同时开发多个应用程序,那这些应用程序都会共用一个Python,就是安装在系统的Python 3。如果应用A需要...

2018-04-12 13:42:14 378 0

原创 Python第三方模块

Pillow    PIL:Python Imaging Library,已经是Python平台事实上的图像处理标准库了。PIL功能非常强大,但API却非常简单易用。PIL仅支持到Python 2.7,Pillow,支持最新Python 3.x,又加入了许多新特性,因此,我们可以直接安装使用Pil...

2018-04-12 13:23:32 158 0

原创 Python常用內建模块

datetime    datetime是Python处理日期和时间的标准库。获取当前日期和时间>>> from datetime import datetime >>> now = datetime.now() ...

2018-04-12 12:06:54 115 0

原创 Python正则表达式

在正则表达式中,如果直接给出字符,就是精确匹配。用\d可以匹配一个数字,\w可以匹配一个字母或数字:    '00\d'可以匹配'007',但无法匹配'00A';    '\d\d\d'可以匹配'010�...

2018-04-08 22:14:17 78 0

原创 Udacity机器学习入门笔记——自选算法 随机森林

自选三个算法之一:随机森林参数调整学习(Google自带翻译ε=(´ο`*))))http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html在ud120-projects...

2018-04-03 12:58:27 142 1

原创 Udacity机器学习入门笔记——决策树

监督学习算法第三种——决策树decision trees    决策树可以通过核技巧把简单的线性决策面转换为非线性决策面    百度百科:决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点...

2018-04-02 16:15:57 375 1

转载 吴恩达机器学习笔记(week1——week5)

    A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at task...

2018-03-30 16:33:48 1960 0

原创 Python进程和线程

    对于操作系统来说,一个任务就是一个进程(Process);在一个进程内部,要同时干多件事,就需要同时运行多个“子任务”,我们把进程内的这些“子任务”称为线程(Thread)。    线程是最小的执行单元,而进程由至少一个线程组成    Python多任务的实现有3种方式:多进程模式;多线程...

2018-03-29 23:37:25 102 0

原创 LeetCode初级算法练习——数组篇

数组篇26. 从排序数组中删除重复项给定一个有序数组,你需要原地删除其中的重复内容,使每个元素只出现一次,并返回新的长度。不要另外定义一个数组,您必须通过用 O(1) 额外内存原地修改输入的数组来做到这一点。示例:给定数组: nums = [1,1,2], 你的函数应该返回新长度 2, 并且原数...

2018-03-29 22:25:52 2186 1

原创 Python面向对象高级编程

1.给实例动态绑定方法:class Student(object): pass>>> s = Student() >>> def set_age(self, age): # 定义一个函数作为实例方法 ......

2018-03-27 23:43:14 93 0

原创 Python模块

     有的函数和变量我们希望仅仅在模块内部使用。在Python中,是通过_前缀来实现的。     类似_xxx和__xxx这样的函数或变量就是非公开的(private),不应该被直接引用,比如_abc,__abc等;之所以我们说,private函数和变量“不应该”被直接引用,而不是“不能”被直...

2018-03-26 16:52:00 58 0

原创 Python函数式编程——高阶函数、返回函数、匿名函数、装饰器、偏函数

函数式编程    函数是Python内建支持的一种封装,通过把大段代码拆成函数,通过一层一层的函数调用,把复杂任务分解成简单的任务,这种分解称之为面向过程的程序设计。函数就是面向过程的程序设计的基本单元。    函数式编程——Functional Programming,虽然也可以归结到面向过程的...

2018-03-23 22:30:21 196 0

原创 Python生成器与迭代器

生成器:generator    列表元素可以按照某种算法推算出来,在循环的过程中不断推算出后续的元素,不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。第一种方法    只要把一个列表生成式的[]改成(),就创建了一个gen...

2018-03-22 23:27:16 113 0

转载 Python练习Django项目——学习笔记

    学习如何使用Django(http://djangoproject.com/ )来开发一个名为“学习笔记”(Learning Log)的项目,这是一个在线日志系统,让你能够记录所学习的有关特定主题的知识。    首先为这个项目制定规范,然后为应用程序使用的数据定义模型。我们将使用Djang...

2018-03-20 22:35:09 3438 4

原创 Python使用Web API数据可视化

    Web应用编程接口 (API)自动请求网站的特定信息而不是整个网页,再对这些信息进行可视化。由于这样编写的程序始终使用最新的数据来生成可视化,因此即便数据瞬息万变,它呈现的信息也都是最新的。    Web API是网站的一部分,用于与使用非常具体的URL请求特定信息的程序交互。这种请求称为...

2018-03-19 19:42:53 6571 4

原创 Python可视化数据学习

使用matplotlib制作图表制作简单的折线图import matplotlib.pyplot as plt input_values = [1,2,3,4,5] squares = [1,4,9,16,25] plt.plot(input_values,squares,linewidth=5...

2018-03-15 13:29:29 648 2

原创 Python调试、异常、测试

调试    1.print()    用print()把可能有问题的变量打印出来,但是用print()最大的坏处是将来还得删掉它,想想程序里到处都是print(),运行结果也会包含很多垃圾信息    2.断言    凡是可能有问题的变量,都可以用断言(assert)来替代:def foo(s): ...

2018-03-08 22:52:49 13961 2

原创 Python之IO编程——文件读写、StringIO/BytesIO、操作文件和目录、序列化

IO编程    IO在计算机中指Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到数据交换的地方,通常是磁盘、网络等,就需要IO接口。从磁盘读取文件到内存,就只有Input操作,反过来,把数据写到磁盘文件里,就只是一个Outpu...

2018-03-07 22:57:40 13330 0

原创 Python数据结构的一些技巧、数据结构练习、循环与判断练习题

Python数据结构的一些技巧多重循环sorted函数按照长短、大小、英文字母的顺序给每个列表中的元素进行排序。sorted函数不会改变列表本身顺序,可以理解为先将列表进行复制,再进行顺序的整理,num_list = [6,2,7,4,1,3,5] print(sorted(num_list))在...

2018-02-01 17:08:37 288 0

原创 Python面向对象编程——类的学习

面向对象编程    面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。    面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过...

2018-01-31 19:15:54 256 0

转载 python基础

变量的命名和使用:1、变量名只能包含字母、数字和下划线。变量名可以字母或下划线打头,但不能以数字打头2、变量名不能包含空格,但可使用下划线来分隔其中的单词3、不要将Python关键字和函数名用作变量名,即不要使用Python保留用于特殊用途的单词注意  就目前而言,应使用小写的Python变量名。...

2018-01-16 17:37:00 92 0

转载 Storm集群安装配置详细步骤(接上篇VM安装及Ubuntu安装)

所有安装包都放在home/user1/strom下 / 配置七台主机:1台nimbus主节点、3台supervisor工作节点、3台zookeeper集群节点。注意,ip地址参考自己主机分配的修改 终端执行 ifconfig 查询ip ...

2018-01-08 22:10:28 286 2

提示
确定要删除当前文章?
取消 删除