自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 玩转算法面试LeetCode算法练习——队列(二叉树层序遍历+BFS和图最短路径)

2.队列         队列与栈类似,差别仅在于向队列里添加元素时,元素被加到尾部(入队),而提取元素时则从队列头部开始(出队)。这种机制称作FIFO(first in, first out,先进先出);而栈则被称作LIFO(last in, first out,后进先出)。         在 Python 的标准库中,有两个类实现了队列。第一是 Queue 类,这是一个同步实现,意味...

2018-07-19 12:33:54 554

转载 吴恩达机器学习笔记(week6——)

http://ai-start.com/ml2014/html/week6.htmlWeek6十、应用机器学习的建议(Advice for Applying Machine Learning)10.1 决定下一步做什么10.2 评估一个假设10.3 模型选择和交叉验证集10.4 诊断偏差和方差10.5 正则化和偏差/方差10.6 学习曲线10.7 决定下一步做什么十一、机器学习系统的设计(Mach...

2018-06-01 23:16:56 766

原创 玩转算法面试LeetCode算法练习——查找问题2

目录 使用查找表的经典问题1. 两数之和15. 三数之和18. 四数之和16. 最接近的三数之和(不完全属于查找表)454. 四数相加 II49. 字母异位词分组447. 回旋镖的数量149. 直线上最多的点数使用查找表的经典问题1. 两数之和给定一个整数数组和一个目标值,找出数组中和为目标值的两个数。你可以假设每个输入只对应一种答案,且同样...

2018-05-31 11:08:29 722

原创 算法复杂度分析

1.时间复杂度:什么是Big O:O(f(n))表示运行算法所需要执行的指令数,和f(n)成正比。n表示数据规模例:随着输入规模n的增大,时间复杂度的增长模式2.数据规模概念:该时间针对的是简单的求和运算,针对算法在该基础上大约除10即可3.空间复杂度:递归的深度是多少,空间复杂度就是多少4.常见的复杂度分析O(1)O(n):一般存在一个for循环且与n有关O(n^2):一般是双重循环且都与n有关...

2018-05-25 11:30:57 8288

转载 用 Python 统计高频字数

转载自http://blog.csdn.net/cxsydjn/article/details/70991846问题(来自Udacity机器学习工程师纳米学位预览课程)用 Python 实现函数 count_words(),该函数输入字符串 s 和数字 n,返回 s 中 n 个出现频率最高的单词。返回值是一个元组列表,包含出现次数最高的 n 个单词及其次数,即 [(<单词1>, &lt...

2018-05-10 10:15:18 1145

原创 Udacity机器学习入门——交叉验证(cross-validation)

测试数据可以让你评估你的分类器或回归在独立数据集上的性能,还能帮助你避免过度拟合在sklearn中训练/测试分离sklearn链接:http://scikit-learn.org/stable/modules/cross_validation.html加载数据集以适应线性SVM:from sklearn import datasetsfrom sklearn.svm import SVCir...

2018-05-09 19:41:13 1376

原创 Udacity机器学习入门——主成分分析PCA

以下数据是一维还是二维练习1:通过PCA找到新坐标系的中心(2,3),△x=1,沿坐标系x’向右移,则△y=1;△y=1,沿坐标系y’向上移,则△x=-1向量长度√2,按原坐标系计算练习2:通过PCA找到新坐标系的中心(3,3),△y=-1,沿坐标系x’移动,则△x=2;△x=1沿坐标系y’移动,则△y=2 x’=0.5a+3.5      x’+△y=0.5(a+△x)+3.5     因为△y...

2018-05-09 11:09:26 1120

原创 Udacity机器学习入门——特征选择

练习:一个新的安然特征练习poi_flag_emal.py if from_emails: ctr=0 while not from_poi and ctr < len(from_emails): if from_emails[ctr] in poi_email_list: from_poi = T...

2018-05-07 17:47:21 742

原创 Udacity机器学习入门——文本学习

文本学习的基本问题与输入特征相关,我们学习的每个文件、每封邮件或每个书名,它的长度都是不标准的,所以不能讲某个单独的词作为输入特征,因此在文本的机器学习中有个功能——词袋Bag of Words,基本理念选定一个文本,然后计算文本的频率Nice Day与A Very Nice Day                                                Mr Day Lov...

2018-05-03 21:42:13 734 1

原创 Udacity机器学习入门——特征缩放

Chirs体重+身高=146.1 Caneron体重+身高=180.9 Serah 体重+身高=120.2                  从数据上看Chirs与S数值更接近,应该穿S大小衣服,但是由于体重和身高的度量标准差异(一个是个位数,一个是百位数)导致体重占据了主导位置,此时就用到特征缩放,使这些特征跨越的范围有可比性,通常是在0和1之间(包含0、1)特征缩放的一个优点是预估输出相对稳定...

2018-04-26 23:48:21 381

原创 Udacity机器学习入门——聚类Clustering

非监督学习:聚类、降维聚类:K-means1.随意画出聚类中心2.分配3.优化连接集群中心,画等距垂直于两集群连线的线优化:移动中心再分配,再优化········直至两个类的正确中心位置很有意思的k-means可视化工具 http://www.naftaliharris.com/blog/visualizing-k-means-clustering/聚类算法 http://scikit-learn...

2018-04-23 23:36:05 748

原创 Udacity机器学习入门——异常值outlier

什么可能导致异常值:根据具体事件选择忽略还是重视(欺诈侦测)传感器故障、(忽略)数据输入错误、(忽略)外部数据×反常事件(通常需要重视)选择异常值异常值检测-删除算法训练异常值检测——找出训练集中访问最多的点,去除这些点(一般约10%的异常数据)再训练 (可能需要重复2、3步骤多次)删除前:删除后异常值删除策略小结:这里要注意有的地方是要保留异常值,去除正常的数据的(异常检测、欺诈检测)。1训练2...

2018-04-23 19:01:41 2536 2

原创 LeetCode初级算法练习——字符串

344. 反转字符串请编写一个函数,其功能是将输入的字符串反转过来。示例:输入:s = "hello"返回:"olleh"class Solution: def reverseString(self, s): """ :type s: str :rtype: str """ #[开始:结束:步进]步进默认=1...

2018-04-20 00:02:10 395

原创 Udacity机器学习入门——回归

连续监督学习连续分类器与离散分类器连续通常是有序的(如年龄,收入(10000和9999是没差的))离散通常是无序的(如入职id(两个人之间不存在任何关系)、天气(晴天或雨天)、根据姓名查找电话号码(连续号码是不存在任何关系的))PS:视为离散的多数事物在某种程度上是连续的(如把天气表示为在某个时间段内日光投射到地面上某一地区的量,即连续的计量))线性回归方程:Target目标变量:尝试预测的变量,...

2018-04-19 20:20:48 392 1

原创 Udacity机器学习入门笔记——数据集与问题

    MORE DATA>FINE-TUNED ALGORITHM    更多的数据集要比经过精密调整的算法可以提供更好的结果,使用更多的数据几乎总能帮助算法取得更好的效果数据类型:值数据:基本特征就是数值(薪水信息)分类数据(categorical):类别变量,监督分类较多,包括有限数量的离散值(职位——有限的工作种类)时序数据:时间变量(邮件中的时间戳、金融)文字数据:词袋模型(邮件内...

2018-04-13 15:20:43 529

原创 Python访问数据库

SQLite3表是数据库中存放关系数据的集合,一个数据库里面通常都包含多个表,表和表之间通过外键关联。要操作关系数据库,首先需要连接到数据库,一个数据库连接称为Connection;连接到数据库后,需要打开游标,称之为Cursor,通过Cursor执行SQL语句,然后,获得执行结果。Python定义了一套操作数据库的API接口,任何数据库要连接到Python,只需要提供符合Python标准的数据库...

2018-04-12 20:57:29 384

原创 Python电子邮件

发邮件流程:假设我们自己的电子邮件地址是me@163.com    电子邮件软件被称为MUA:Mail User Agent——邮件用户代理。(Outlook或者Foxmail之类的软件)    Email从MUA发出去,不是直接到达对方电脑,而是发到MTA:Mail Transfer Agent——邮件传输代理,即Email服务提供商,比如网易、新浪等等,由于自己的电子邮件是163.com,所以...

2018-04-12 16:25:46 390

原创 Python网络编程TCP/UDP

TCP/IP简介    互联网协议包含了上百种协议标准,但是最重要的两个协议是TCP和IP协议,所以,大家把互联网的协议简称TCP/IP协议。    通信的时候,双方必须知道对方的标识,好比发邮件必须知道对方的邮件地址。互联网上每个计算机的唯一标识就是IP地址,类似123.123.123.123。如果一台计算机同时接入到两个或更多的网络,比如路由器,它就会有两个或多个IP地址,所以,IP地址对应的...

2018-04-12 16:00:11 564

原创 virtualenv创建隔离python运行环境

    在开发Python应用程序的时候,系统安装的Python3只有一个版本:3.6。所有第三方的包都会被pip安装到Python3的site-packages目录下。    如果我们要同时开发多个应用程序,那这些应用程序都会共用一个Python,就是安装在系统的Python 3。如果应用A需要jinja 2.7,而应用B需要jinja 2.6这种情况下,每个应用可能需要各自拥有一套“独立”的P...

2018-04-12 13:42:14 565

原创 Python第三方模块

Pillow    PIL:Python Imaging Library,已经是Python平台事实上的图像处理标准库了。PIL功能非常强大,但API却非常简单易用。PIL仅支持到Python 2.7,Pillow,支持最新Python 3.x,又加入了许多新特性,因此,我们可以直接安装使用Pillow。操作图像最常见的图像缩放操作,只需三四行代码:from PIL import Image#...

2018-04-12 13:23:32 308

原创 Python常用內建模块

datetime    datetime是Python处理日期和时间的标准库。获取当前日期和时间>>> from datetime import datetime>>> now = datetime.now() # 获取当前datetime>>> print(now)2015-05-18 16:28:07.198690>>&...

2018-04-12 12:06:54 243

原创 Python正则表达式

在正则表达式中,如果直接给出字符,就是精确匹配。用\d可以匹配一个数字,\w可以匹配一个字母或数字:    '00\d'可以匹配'007',但无法匹配'00A';    '\d\d\d'可以匹配'010';    '\w\w\d'可以匹配'py3';.可以匹配任意字符,所以:    'py.'可以匹配'pyc'、'pyo'、'py!'等等。    要匹配变长的字符,在正则表达式中,用*表示任意个字...

2018-04-08 22:14:17 180

原创 Udacity机器学习入门笔记——自选算法 随机森林

自选三个算法之一:随机森林参数调整学习(Google自带翻译ε=(´ο`*))))http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html在ud120-projects\choose_your_own\your_algorithm.py中添加以下代码from sklea...

2018-04-03 12:58:27 257 1

原创 Udacity机器学习入门笔记——决策树

监督学习算法第三种——决策树decision trees    决策树可以通过核技巧把简单的线性决策面转换为非线性决策面    百度百科:决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值    通过坐标数据进行多次分割,找出分界线,绘制决策树。在机器...

2018-04-02 16:15:57 674 1

转载 吴恩达机器学习笔记(week1——week5)

    A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience ...

2018-03-30 16:33:48 3906

原创 Python进程和线程

    对于操作系统来说,一个任务就是一个进程(Process);在一个进程内部,要同时干多件事,就需要同时运行多个“子任务”,我们把进程内的这些“子任务”称为线程(Thread)。    线程是最小的执行单元,而进程由至少一个线程组成    Python多任务的实现有3种方式:多进程模式;多线程模式;多进程+多线程模式多进程    了解操作系统的相关知识,Unix/Linux操作系统提供了一个f...

2018-03-29 23:37:25 239

原创 LeetCode初级算法练习——数组篇

数组篇26. 从排序数组中删除重复项给定一个有序数组,你需要原地删除其中的重复内容,使每个元素只出现一次,并返回新的长度。不要另外定义一个数组,您必须通过用 O(1) 额外内存原地修改输入的数组来做到这一点。示例:给定数组: nums = [1,1,2],你的函数应该返回新长度 2, 并且原数组nums的前两个元素必须是1和2不需要理会新的数组长度后面的元素Given a sorted ar...

2018-03-29 22:25:52 2781 1

原创 Python面向对象高级编程

1.给实例动态绑定方法:class Student(object): pass>>> s = Student()>>> def set_age(self, age): # 定义一个函数作为实例方法...     self.age = age...>>> from types import MethodType>>&...

2018-03-27 23:43:14 299

原创 Python模块

     有的函数和变量我们希望仅仅在模块内部使用。在Python中,是通过_前缀来实现的。     类似_xxx和__xxx这样的函数或变量就是非公开的(private),不应该被直接引用,比如_abc,__abc等;之所以我们说,private函数和变量“不应该”被直接引用,而不是“不能”被直接引用,是因为Python并没有一种方法可以完全限制访问private函数或变量,但是,从编程习惯上不...

2018-03-26 16:52:00 128

原创 Python函数式编程——高阶函数、返回函数、匿名函数、装饰器、偏函数

函数式编程    函数是Python内建支持的一种封装,通过把大段代码拆成函数,通过一层一层的函数调用,把复杂任务分解成简单的任务,这种分解称之为面向过程的程序设计。函数就是面向过程的程序设计的基本单元。    函数式编程——Functional Programming,虽然也可以归结到面向过程的程序设计,但其思想更接近数学计算。    函数式编程是一种抽象程度很高的编程范式,纯粹的函数式编程语言...

2018-03-23 22:30:21 500

原创 Python生成器与迭代器

生成器:generator    列表元素可以按照某种算法推算出来,在循环的过程中不断推算出后续的元素,不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。第一种方法    只要把一个列表生成式的[]改成(),就创建了一个generator:g = (x * x for x in range(10))for i in g: ...

2018-03-22 23:27:16 190

转载 Python练习Django项目——学习笔记

    学习如何使用Django(http://djangoproject.com/ )来开发一个名为“学习笔记”(Learning Log)的项目,这是一个在线日志系统,让你能够记录所学习的有关特定主题的知识。    首先为这个项目制定规范,然后为应用程序使用的数据定义模型。我们将使用Django的管理系统来输入一些初始数据,再学习编写视图和模板,让Django能够为我们的网站创建网页。最后将改...

2018-03-20 22:35:09 5926 4

原创 Python使用Web API数据可视化

    Web应用编程接口 (API)自动请求网站的特定信息而不是整个网页,再对这些信息进行可视化。由于这样编写的程序始终使用最新的数据来生成可视化,因此即便数据瞬息万变,它呈现的信息也都是最新的。    Web API是网站的一部分,用于与使用非常具体的URL请求特定信息的程序交互。这种请求称为API调用。请求的数据将以易于处理的格式(如JSON或CSV)返回。依赖于外部数据源的大多数应用程序都...

2018-03-19 19:42:53 9358 4

原创 Python可视化数据学习

使用matplotlib制作图表制作简单的折线图import matplotlib.pyplot as pltinput_values = [1,2,3,4,5]squares = [1,4,9,16,25]plt.plot(input_values,squares,linewidth=5)#设置图表标题,并给坐标轴加上标签plt.title("Square Number",fonts...

2018-03-15 13:29:29 1412 2

原创 Python调试、异常、测试

调试    1.print()    用print()把可能有问题的变量打印出来,但是用print()最大的坏处是将来还得删掉它,想想程序里到处都是print(),运行结果也会包含很多垃圾信息    2.断言    凡是可能有问题的变量,都可以用断言(assert)来替代:def foo(s): n = int(s) assert n != 0, 'n is zero!' ...

2018-03-08 22:52:49 25977 4

原创 Python之IO编程——文件读写、StringIO/BytesIO、操作文件和目录、序列化

IO编程    IO在计算机中指Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到数据交换的地方,通常是磁盘、网络等,就需要IO接口。从磁盘读取文件到内存,就只有Input操作,反过来,把数据写到磁盘文件里,就只是一个Output操作。    由于CPU和内存的速度远远高于外设的速度,所以,在IO编程中,就存在速度严重不匹配的问...

2018-03-07 22:57:40 23759

原创 Python数据结构的一些技巧、数据结构练习、循环与判断练习题

Python数据结构的一些技巧多重循环sorted函数按照长短、大小、英文字母的顺序给每个列表中的元素进行排序。sorted函数不会改变列表本身顺序,可以理解为先将列表进行复制,再进行顺序的整理,num_list = [6,2,7,4,1,3,5]print(sorted(num_list))在使用默认参数reverse后李彪可以按照逆序整理:sorted(num_list,reverse=Tr...

2018-02-01 17:08:37 601

原创 Python面向对象编程——类的学习

面向对象编程    面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。    面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过程把函数继续切分为子函数,即把大块函数通过切割成小块函数来降低系统的复杂度。而面向对象的程序设计把计算...

2018-01-31 19:15:54 506

转载 python基础

变量的命名和使用:1、变量名只能包含字母、数字和下划线。变量名可以字母或下划线打头,但不能以数字打头2、变量名不能包含空格,但可使用下划线来分隔其中的单词3、不要将Python关键字和函数名用作变量名,即不要使用Python保留用于特殊用途的单词注意  就目前而言,应使用小写的Python变量名。在变量名中使用大写字母虽然不会导致错误,但避免使用大写字母是个不错的主意input()最后看一个有问题...

2018-01-16 17:37:00 206

转载 Storm集群安装配置详细步骤(接上篇VM安装及Ubuntu安装)

所有安装包都放在home/user1/strom下 /配置七台主机:1台nimbus主节点、3台supervisor工作节点、3台zookeeper集群节点。注意,ip地址参考自己主机分配的修改终端执行 ifconfig 查询ip主机名(节点)IP地址内存(GB)VCPU(个

2018-01-08 22:10:28 753 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除