自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Harrytsz的博客

既然选择远方,便只顾风雨兼程。

  • 博客(27)
  • 资源 (10)
  • 收藏
  • 关注

原创 网络是怎样连接的(4)

1.4 委托协议栈发送信息1.4.1 数据收发操作概览知道了 IP 地址之后,就可以委托操作系统内部的协议栈向这个目标 IP 地址,也就是我们要访问的 Web 服务器发送消息了。要发送给 Web 服务器的 HTTP 消息是一种数字信息,因此也可以说是委托协议栈来发送数字信息。收发数字信息这一操作不仅限于浏览器,对于各种使用网络的应用程序来说都是共通的。因此,这一操作的过程也不仅适用于 Web,...

2018-11-03 17:44:51 674

转载 蒙特卡洛方法到底有什么用

    蒙特卡洛方法(Monte Carlo method,也有翻译成“蒙特卡罗方法”)是以概率和统计的理论、方法为基础的一种数值计算方法,将所求解的问题同一定的概率模型相联系,用计算机实现统计模拟或抽样,以获得问题的近似解,故又称随机抽样法或统计试验法。上述就是蒙特卡洛方法的基本概念,比较抽象,下面结合实际工作中的理解,谈一谈对蒙特卡洛方法的一些认识。(1)首先,蒙...

2018-11-30 15:36:02 764

转载 30分钟了解蒙特卡洛方法

30分钟入门蒙特卡洛模拟本文主要讲解三部分:背景介绍蒙特卡洛方法介绍结果展示背景介绍  这一小节我们简要介绍一下引出蒙特卡洛方法的实际场景。   机器学习/深度学习中的图像叠加文字识别需要大量的训练样本,自动生成样本(使用程序在背景图片上叠加文字)是一种样本的获取方式。但色彩值(为了兼顾各方向的同学,原谅我用一个这么不专业的词汇,此值可以是RGB到[0,1]区间的映射,让它能代...

2018-11-30 15:34:30 819

转载 上海交大张志华教授《机器学习导论》和《统计机器学习》公开课视频的正确播放顺序

张志华教授的两门机器学习公开课是很好的机器学习资源。但在上海交大的公开课视频网站上挂出的教学视频顺序有点乱。对于初学者来说,如果没看对顺序的话,会觉得讲得很乱,从而错过这么优质的资源。事实上板书很完整,有电子版讲义可下载。只是讲义上有个别地方有点笔误,但不影响理解。能用黑板直接推导的老师的逻辑和思路都是很清晰的!正确的顺序应如下所示:《机器学习导论》:http://ocw.sjtu.edu...

2018-11-29 17:09:38 2109 6

原创 麦子学院深度学习基础 —— 机器学习 —— 最邻近规则分类(K-Nearest Neighbor)KNN 算法应用

麦子学院深度学习基础 —— 机器学习 —— 最邻近规则分类(K-Nearest Neighbor)KNN 算法应用标签 : 深度学习基础4.2 最邻近规则分类 KNN 算法应用1.数据集介绍鸢尾花数据集:150 个实例萼片长度(sepal length)、萼片宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)。类别:Iris ...

2018-11-24 21:23:40 421

原创 麦子学院深度学习基础 —— 机器学习 —— 最近邻规则分类 KNN 算法

麦子学院深度学习基础 —— 机器学习 —— 最近邻规则分类 KNN 算法标签(空格分隔): 深度学习基础最邻近规则分类(K-Nearest Neighbor)KNN 算法1.综述:1.1 Cover 和 Hart 在 1968 年提出了最初的近邻算法。1.2 分类(Classification)算法。1.3 输入基于实例的学习(instance-based learning)、懒惰学...

2018-11-24 16:55:29 640

原创 第 2 章 决 策 树

∗∗第2章决策树∗∗ **第 2 章 决策树**∗∗第2章决策树∗∗2.1 概述决策树(DecisionTreeDecision TreeDecisionTree)是功能强大而且相当受欢迎的分类和预测方法,它是一种有监督的学习算法,以树状图为基础,其输出结果为一系列简单实用的规则,故得名决策树。决策树就是一系列的 if−thenif-thenif−then 语句,决策树可以用于分类问题,也可以...

2018-11-23 14:45:40 433

转载 更改Anaconda中Jupyter的默认文件保存目录

总结:修改Anaconda中的Jupyter Notebook默认工作路径的三种方式方式1.打开Windows的cmd,在cmd中输入jupyter notebook --generate-config如下图: 可以看到路径为D:\Users……找到此路径修改jupyter_notebook_config.py文件 打开此文件找到## The directory to use...

2018-11-22 15:01:03 6797

转载 人脸识别(一)调用face++实现人脸检测。

2017年下半年以来,随着iPhoneX的人脸解锁功能把人脸识别这一黑科技带入大家的视野中之后,各种有关人脸识别功能的新闻和报道层出不穷。不仅是对普通群众来说,对我们程序猿来说,百度,微软,阿里等各大公司推出的可供调用的人脸识别api也如雨后春笋一般冒出来。鉴于公司以后业务发展需要,同时也是个人兴趣所致,对调用其他公司api实现人脸识别进行了一定的技术调研,于是调研成果写成几篇博客分享出来,供大家...

2018-11-22 13:38:03 822

转载 scikit-learn algorithm cheat sheet】【汉化版】scikit-learn算法选择路径图

英文原版链接:http://scikit-learn.org/stable/tutorial/machine_learning_map/看得有点累,做了个汉化版汉化版:(有很多名词合理地强行翻译了一下,否则全英文的词汇太多,不通顺的时候,请看看下面的原版)英文原版(2016年9月30日最后更新): ...

2018-11-20 11:17:13 654

原创 [Python] BFS和DFS算法(第3讲)—— 从BFS到Dijkstra算法

在 BFS 中:Dijska 算法中使用优先队列:A 到 F 最短路径为:Dijkstra 代码如下:graph = { "A" : {"B":5, "C":1}, "B" : {"A":5, "C":2, "D":1}, "C" : {"A":1, "B&quot

2018-11-18 23:12:44 903

原创 Python 实现 BFS 和 DFS

# BFSgraph = { "A" : ["B", "C"], "B" : ["A", "C", "D"], &

2018-11-18 20:20:03 2473

转载 达观杯比赛复盘专题

达观杯比赛简介特征工程1.构建特征countvectororizerTfidfVectorizerDoc2VecHashingVectorizerlength降维lsa 和 ldaSelectFromModel2.组合特征tfidf(word+article)tfidf(word+article)+lsatfidf(word+article+length)lin...

2018-11-14 11:04:58 161

原创 新版mysql驱动的安装mysql-installer-community-5.7.21.0.msi这个版本为例

不多说,直接上干货!说在前面的话  我为什么已经尝试和使用过同类型产品的很多MySQL版本,还要书写这篇博客呢?基于mysql-installer-web-community-5.7.18.1.msi  是因为,最近在做数据分析相关的研究工作。  首先,跟大家解释下mysql-installer-web-community的mysq和mysql-installer-communit...

2018-11-12 21:14:59 12286

转载 Python实现二叉树的建立以及遍历(递归前序、中序、后序遍历,队栈前序、中序、后序、层次遍历)

class Node: def __init__(self,data): self.data=data self.lchild=None self.rchild=Noneclass Tree: def __init__(self): self.queue=[]#利用队列存储树的节点 self.fla...

2018-11-09 15:00:37 414

转载 前缀、中缀、后缀表达式(逆波兰表达式)

前缀、中缀、后缀表达式(逆波兰表达式) 前缀、中缀、后缀表达式(逆波兰表达式)介绍前缀表达式、中缀表达式、后缀表达式都是四则运算的表达方式,用以四则运算表达式求值,即数学表达式的求职中缀表达式简介中缀表达式就是常见的运算表达式,如(3+4)×5-6前缀表达式简介前缀表达式又称波兰式,前缀表达式的运算符位于操作数之前比如:-...

2018-11-08 23:05:00 260

原创 足球比赛出线问题

足球比赛,一个小组有8支球队进行单循环赛,胜者积3分,平则算法同积1分,负则不积分,规定积分最高的4支球队出线,则出线至少需要多少分?未出线最多可能有多少分?思路:循环赛的概念是每一支球队会与其他所有球队各进行一场比赛。8支球队共进行8*7/2=28场比赛。1、出线至少需要多少分?赢得比赛积分最快,打平积分增长慢,输掉比赛积分不变。如果想以最少的积分赢,着眼点应该在第四名上。对于第四名...

2018-11-08 22:30:54 1888

原创 生日悖论

计算生日悖论概率假设一个班级有n个人,那么计算这n个人至少有两个人生日相同的概率。 一般情况下,我们感性认识上会觉得班级上至少有两个人生日相同的概率会比较低,毕竟每个人的生日有365种选择,而班级一半只有30人左右,但是实际上计算得到的至少两人生日相同的概率却远远大于我们的感性认识,所以称为生日悖论。计算生日概率假设班级有n个人,我们从反面计算至少有两个人生日相同的概率,这个反面就是每...

2018-11-08 13:42:44 4747

原创 设计模式 之 策略模式

设计模式 之 策略模式文章目录设计模式 之 策略模式@[toc]策略模式原理1.模拟鸭子项目2.项目的新需求3.用 OO 原则解决新需求的不足4.用策略模式来解决新需求5.重新设计模拟鸭子项目6.总结策略模式定义策略模式示例演示策略模式的注意点策略模式原理1.模拟鸭子项目1.1.从项目“模拟鸭子游戏”开始1.2从 OO 的角度设计这个项目,鸭子超类,扩展超类:public abstra...

2018-11-07 23:14:43 133

原创 设计模式

设计模式入门1.设计模式是人们在面对同类型软件工程设计问题所总结出的一些有用经验。模式不是代码,而是某类问题的通用设计解决方案。2.4人组 Erich Gamma、Richard Helm、Ralph Johnson、John Vlissides 总结写了《设计模式》。3.设计模式的有点和用途。4.学习设计模式最好的方式:在你的设计和以往的工程里寻找何处可以使用它们。5.设计模式的本质目...

2018-11-07 21:23:53 139

转载 机器学习经典书籍和论文集合

原文地址:http://blog.sina.com.cn/s/blog_7e5f32ff0102vlgj.html入门书单1.《数学之美》PDF6 作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。2.《Programming Collective Intelligence》(《集体智慧编程》)PDF3 作者Toby Segaran也是《Beaut...

2018-11-04 19:10:55 3242

原创 网络是怎样连接的(3)

2.1.3. Socket 库提供查询 IP 地址的功能查询 IP 地址的方法非常简单,只要询问最近的 DNS 服务器 “www.lab.glasscom.com 的 IP 地址是什么” 就可以了,DNS 服务器会回答说“该服务器的 IP 地址为 xxx.xxx.xxx.xxx”。这一步非常简单,很多读者也都很熟悉,那么浏览器是如何向 DNS 服务器发出查询的呢?让我们把向 Web 服务器发送请...

2018-11-03 17:09:55 596

原创 网络是怎样连接的(2)

第 1 部分 生成 HTTP 请求消息2.1. 向 DNS 服务器查询 Web 服务器的 IP 地址2.1.1 IP 地址的基本知识生成 HTTP 消息之后,接下来我们需要委托操作系统将消息发送给 Web 服务器。尽管浏览器能够解析网址并生成 HTTP 消息,但它本身并不具备将消息发送到网络中的功能,因此这一功能需要委托操作系统来实现。在进行这一操作时,我们还有一个工作需要完成,那就是查询网...

2018-11-03 16:27:59 1805

原创 网络是怎样连接的(1)

1.1探索之旅从输入网址开始我们的探索之旅从在浏览器中输入网址开始。网址,准确来说应该叫 URL。常见的网址开头有:http:、ftp:、file:、mailto:等等。之所以有各种各样的 URL,是因为尽管我们通常是使用浏览器来访问 Web 服务器的,但实际上浏览器并不只有这一个功能,它也可以用来在 FTP 服务器上下载和上传文件,同时也具备电子邮件客户端的功能。可以说,浏览器是一个具备多种...

2018-11-03 11:58:50 626

原创 网络探索之旅路线图

2018-11-03 10:45:07 712

原创 PyCharm —— 开发者信息设置

PyCharm 开发者信息设置在团队开发中,需要在代码中编写一些项目信息或个人信息,如开发者、开发时间、项目名称等信息,以利于后期对项目修改和维护。如果每次都需要手动编写,费时费力。下面介绍如何自动在diamante文件中自动生成这些信息。(1)打开 PyCharm 开发环境,在菜单中依次选择 File —> Settings (或使用快捷键:<Ctrl + Alt + S>...

2018-11-02 19:50:47 2096

转载 机器学习系列(12)_XGBoost参数调优完全指南(附Python代码)

1. 简介如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。 构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。所以为了提高模型的表现,参数的调整十分必要。在解决实际问题的时候,有些问题是很难回答的—...

2018-11-02 14:57:26 358

概率论基础概念科普介绍

概率论基础概念科普介绍

2021-09-04

线性代数基础概念科普介绍

线性代数基础概念科普介绍

2021-09-04

邹博机器学习课件

邹博 机器学习升级版VII 课程讲义 PPT 共 23 课,高清

2018-11-08

Java jdk api 1.8

下载后,若出现chm文件打开但无内容显示情况,请右击文件,选择属性,并勾选“解除锁定”即可打开文件。

2018-09-02

GoogleFileSystem-Bigtable-MapReduce

Google大数据“三驾马车”Google File System(GFS)、BigTable、MapReduce 中文版文献

2018-08-12

统计学经典教材小合集

本集合中包括以下文档: 1)统计学完全教程 2)赤裸裸的统计学(查尔斯) 3)概率论与数理统计(陈希孺) 4)概率统计(Probability and Statistics) 5)女士品茶20世纪统计学怎样变革了科学 6)数学学科专题史丛书:数理统计学简史 7)统计学思维:程序员数学之概率统计 本集合旨在从统计学角度出发入门机器学习,以期对统计学有个全面的了解

2017-10-13

深入分析Java Web技术内幕

《深入分析Java Web技术内幕(修订版)》新增了淘宝在无线端的应用实践,包括:CDN 动态加速、多终端化改造、 多终端Session 统一 ,以及在大流量的情况下,如何跨越性能、网络和一个地区的电力瓶颈等内容,并提供了比较完整的解决方案。 《深入分析Java Web技术内幕(修订版)》主要围绕Java Web 相关技术从三方面全面、深入地进行了阐述。首先介绍 前端知识,即在JavaWeb 开发中涉及的一些基本知识,包括Web 请求过程、HTTP、DNS 技术和CDN 技术。其次深入介绍了Java 技术,包括I/O 技术、中文编码问题、Javac 编译原理、class 文件结构解析、ClassLoader 工作机制及JVM 的内存管理等。最后介绍了Java 服务端技术,主要包括Servlet、Session 与Cookie、Tomcat 与Jetty服务器、Spring 容器、iBatis 框架和Velocity 框架等原理介绍,并介绍了服务端的一些优化技术。 《深入分析Java Web技术内幕(修订版)》不仅介绍这些技术和框架的工作原理,而且结合示例来讲解,通过通俗易懂的文字和丰富、生动的配图,让读者充分并深入理解它们的内部工作原理,同时还结合了设计模式来介绍这些技术背后的架构思维。 作者简介 · · · · · · 许令波,毕业于合肥工业大学,获计算机硕士学位。热爱Java Web技术,关注服务端性能优化,热衷开源技术的研究和分享,曾获developerWorks最佳作者称号。2009年进入淘宝工作,目前从事模板渲染框架与MVC框架的开发与应用、Java Web的性能优化、高访问量系统静态化和商品详情系统的业务改造等工作。

2017-10-13

CC150(CareerCup)

cc150,全名cracking the coding interview - 150 Programming Questions and Solutions。经典中的经典,曾有人别的啥都不做,刷这本书三四遍,拿了Google的offer(注意是在美国,在中国就算了……)这本书的优势在于分章节,每章突出一块知识,题目精炼,答案好找;缺点呢,你写出的代码,需要深度检验,而cc150是书不是online judge,这个还是做不到。

2017-06-14

技术之瞳 阿里巴巴技术笔试心得-2016.11-p260

技术之瞳--阿里巴巴技术笔试心得

2017-03-02

《算法新解》中文pdf

1. 七年磨一剑,亚马逊中国高级研发人员重磅力作 2. 函数式算法与常规算法对照解读 3. 伪代码与多语言实现并存,充分发挥语言特性 4. 涵盖C/C++、Haskell、Python、Scheme等 5. 理论与实例结合,轻松学习算法与数据结构 6. 内含ACM竞赛趣题和传统趣题,发现算法的乐趣

2017-02-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除