- 博客(27)
- 资源 (10)
- 收藏
- 关注
原创 网络是怎样连接的(4)
1.4 委托协议栈发送信息1.4.1 数据收发操作概览知道了 IP 地址之后,就可以委托操作系统内部的协议栈向这个目标 IP 地址,也就是我们要访问的 Web 服务器发送消息了。要发送给 Web 服务器的 HTTP 消息是一种数字信息,因此也可以说是委托协议栈来发送数字信息。收发数字信息这一操作不仅限于浏览器,对于各种使用网络的应用程序来说都是共通的。因此,这一操作的过程也不仅适用于 Web,...
2018-11-03 17:44:51 674
转载 蒙特卡洛方法到底有什么用
蒙特卡洛方法(Monte Carlo method,也有翻译成“蒙特卡罗方法”)是以概率和统计的理论、方法为基础的一种数值计算方法,将所求解的问题同一定的概率模型相联系,用计算机实现统计模拟或抽样,以获得问题的近似解,故又称随机抽样法或统计试验法。上述就是蒙特卡洛方法的基本概念,比较抽象,下面结合实际工作中的理解,谈一谈对蒙特卡洛方法的一些认识。(1)首先,蒙...
2018-11-30 15:36:02 764
转载 30分钟了解蒙特卡洛方法
30分钟入门蒙特卡洛模拟本文主要讲解三部分:背景介绍蒙特卡洛方法介绍结果展示背景介绍 这一小节我们简要介绍一下引出蒙特卡洛方法的实际场景。 机器学习/深度学习中的图像叠加文字识别需要大量的训练样本,自动生成样本(使用程序在背景图片上叠加文字)是一种样本的获取方式。但色彩值(为了兼顾各方向的同学,原谅我用一个这么不专业的词汇,此值可以是RGB到[0,1]区间的映射,让它能代...
2018-11-30 15:34:30 819
转载 上海交大张志华教授《机器学习导论》和《统计机器学习》公开课视频的正确播放顺序
张志华教授的两门机器学习公开课是很好的机器学习资源。但在上海交大的公开课视频网站上挂出的教学视频顺序有点乱。对于初学者来说,如果没看对顺序的话,会觉得讲得很乱,从而错过这么优质的资源。事实上板书很完整,有电子版讲义可下载。只是讲义上有个别地方有点笔误,但不影响理解。能用黑板直接推导的老师的逻辑和思路都是很清晰的!正确的顺序应如下所示:《机器学习导论》:http://ocw.sjtu.edu...
2018-11-29 17:09:38 2109 6
原创 麦子学院深度学习基础 —— 机器学习 —— 最邻近规则分类(K-Nearest Neighbor)KNN 算法应用
麦子学院深度学习基础 —— 机器学习 —— 最邻近规则分类(K-Nearest Neighbor)KNN 算法应用标签 : 深度学习基础4.2 最邻近规则分类 KNN 算法应用1.数据集介绍鸢尾花数据集:150 个实例萼片长度(sepal length)、萼片宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)。类别:Iris ...
2018-11-24 21:23:40 421
原创 麦子学院深度学习基础 —— 机器学习 —— 最近邻规则分类 KNN 算法
麦子学院深度学习基础 —— 机器学习 —— 最近邻规则分类 KNN 算法标签(空格分隔): 深度学习基础最邻近规则分类(K-Nearest Neighbor)KNN 算法1.综述:1.1 Cover 和 Hart 在 1968 年提出了最初的近邻算法。1.2 分类(Classification)算法。1.3 输入基于实例的学习(instance-based learning)、懒惰学...
2018-11-24 16:55:29 640
原创 第 2 章 决 策 树
∗∗第2章决策树∗∗ **第 2 章 决策树**∗∗第2章决策树∗∗2.1 概述决策树(DecisionTreeDecision TreeDecisionTree)是功能强大而且相当受欢迎的分类和预测方法,它是一种有监督的学习算法,以树状图为基础,其输出结果为一系列简单实用的规则,故得名决策树。决策树就是一系列的 if−thenif-thenif−then 语句,决策树可以用于分类问题,也可以...
2018-11-23 14:45:40 433
转载 更改Anaconda中Jupyter的默认文件保存目录
总结:修改Anaconda中的Jupyter Notebook默认工作路径的三种方式方式1.打开Windows的cmd,在cmd中输入jupyter notebook --generate-config如下图: 可以看到路径为D:\Users……找到此路径修改jupyter_notebook_config.py文件 打开此文件找到## The directory to use...
2018-11-22 15:01:03 6797
转载 人脸识别(一)调用face++实现人脸检测。
2017年下半年以来,随着iPhoneX的人脸解锁功能把人脸识别这一黑科技带入大家的视野中之后,各种有关人脸识别功能的新闻和报道层出不穷。不仅是对普通群众来说,对我们程序猿来说,百度,微软,阿里等各大公司推出的可供调用的人脸识别api也如雨后春笋一般冒出来。鉴于公司以后业务发展需要,同时也是个人兴趣所致,对调用其他公司api实现人脸识别进行了一定的技术调研,于是调研成果写成几篇博客分享出来,供大家...
2018-11-22 13:38:03 822
转载 scikit-learn algorithm cheat sheet】【汉化版】scikit-learn算法选择路径图
英文原版链接:http://scikit-learn.org/stable/tutorial/machine_learning_map/看得有点累,做了个汉化版汉化版:(有很多名词合理地强行翻译了一下,否则全英文的词汇太多,不通顺的时候,请看看下面的原版)英文原版(2016年9月30日最后更新): ...
2018-11-20 11:17:13 654
原创 [Python] BFS和DFS算法(第3讲)—— 从BFS到Dijkstra算法
在 BFS 中:Dijska 算法中使用优先队列:A 到 F 最短路径为:Dijkstra 代码如下:graph = { "A" : {"B":5, "C":1}, "B" : {"A":5, "C":2, "D":1}, "C" : {"A":1, "B"
2018-11-18 23:12:44 903
原创 Python 实现 BFS 和 DFS
# BFSgraph = { "A" : ["B", "C"], "B" : ["A", "C", "D"], &
2018-11-18 20:20:03 2473
转载 达观杯比赛复盘专题
达观杯比赛简介特征工程1.构建特征countvectororizerTfidfVectorizerDoc2VecHashingVectorizerlength降维lsa 和 ldaSelectFromModel2.组合特征tfidf(word+article)tfidf(word+article)+lsatfidf(word+article+length)lin...
2018-11-14 11:04:58 161
原创 新版mysql驱动的安装mysql-installer-community-5.7.21.0.msi这个版本为例
不多说,直接上干货!说在前面的话 我为什么已经尝试和使用过同类型产品的很多MySQL版本,还要书写这篇博客呢?基于mysql-installer-web-community-5.7.18.1.msi 是因为,最近在做数据分析相关的研究工作。 首先,跟大家解释下mysql-installer-web-community的mysq和mysql-installer-communit...
2018-11-12 21:14:59 12286
转载 Python实现二叉树的建立以及遍历(递归前序、中序、后序遍历,队栈前序、中序、后序、层次遍历)
class Node: def __init__(self,data): self.data=data self.lchild=None self.rchild=Noneclass Tree: def __init__(self): self.queue=[]#利用队列存储树的节点 self.fla...
2018-11-09 15:00:37 414
转载 前缀、中缀、后缀表达式(逆波兰表达式)
前缀、中缀、后缀表达式(逆波兰表达式) 前缀、中缀、后缀表达式(逆波兰表达式)介绍前缀表达式、中缀表达式、后缀表达式都是四则运算的表达方式,用以四则运算表达式求值,即数学表达式的求职中缀表达式简介中缀表达式就是常见的运算表达式,如(3+4)×5-6前缀表达式简介前缀表达式又称波兰式,前缀表达式的运算符位于操作数之前比如:-...
2018-11-08 23:05:00 260
原创 足球比赛出线问题
足球比赛,一个小组有8支球队进行单循环赛,胜者积3分,平则算法同积1分,负则不积分,规定积分最高的4支球队出线,则出线至少需要多少分?未出线最多可能有多少分?思路:循环赛的概念是每一支球队会与其他所有球队各进行一场比赛。8支球队共进行8*7/2=28场比赛。1、出线至少需要多少分?赢得比赛积分最快,打平积分增长慢,输掉比赛积分不变。如果想以最少的积分赢,着眼点应该在第四名上。对于第四名...
2018-11-08 22:30:54 1888
原创 生日悖论
计算生日悖论概率假设一个班级有n个人,那么计算这n个人至少有两个人生日相同的概率。 一般情况下,我们感性认识上会觉得班级上至少有两个人生日相同的概率会比较低,毕竟每个人的生日有365种选择,而班级一半只有30人左右,但是实际上计算得到的至少两人生日相同的概率却远远大于我们的感性认识,所以称为生日悖论。计算生日概率假设班级有n个人,我们从反面计算至少有两个人生日相同的概率,这个反面就是每...
2018-11-08 13:42:44 4747
原创 设计模式 之 策略模式
设计模式 之 策略模式文章目录设计模式 之 策略模式@[toc]策略模式原理1.模拟鸭子项目2.项目的新需求3.用 OO 原则解决新需求的不足4.用策略模式来解决新需求5.重新设计模拟鸭子项目6.总结策略模式定义策略模式示例演示策略模式的注意点策略模式原理1.模拟鸭子项目1.1.从项目“模拟鸭子游戏”开始1.2从 OO 的角度设计这个项目,鸭子超类,扩展超类:public abstra...
2018-11-07 23:14:43 133
原创 设计模式
设计模式入门1.设计模式是人们在面对同类型软件工程设计问题所总结出的一些有用经验。模式不是代码,而是某类问题的通用设计解决方案。2.4人组 Erich Gamma、Richard Helm、Ralph Johnson、John Vlissides 总结写了《设计模式》。3.设计模式的有点和用途。4.学习设计模式最好的方式:在你的设计和以往的工程里寻找何处可以使用它们。5.设计模式的本质目...
2018-11-07 21:23:53 139
转载 机器学习经典书籍和论文集合
原文地址:http://blog.sina.com.cn/s/blog_7e5f32ff0102vlgj.html入门书单1.《数学之美》PDF6 作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。2.《Programming Collective Intelligence》(《集体智慧编程》)PDF3 作者Toby Segaran也是《Beaut...
2018-11-04 19:10:55 3242
原创 网络是怎样连接的(3)
2.1.3. Socket 库提供查询 IP 地址的功能查询 IP 地址的方法非常简单,只要询问最近的 DNS 服务器 “www.lab.glasscom.com 的 IP 地址是什么” 就可以了,DNS 服务器会回答说“该服务器的 IP 地址为 xxx.xxx.xxx.xxx”。这一步非常简单,很多读者也都很熟悉,那么浏览器是如何向 DNS 服务器发出查询的呢?让我们把向 Web 服务器发送请...
2018-11-03 17:09:55 596
原创 网络是怎样连接的(2)
第 1 部分 生成 HTTP 请求消息2.1. 向 DNS 服务器查询 Web 服务器的 IP 地址2.1.1 IP 地址的基本知识生成 HTTP 消息之后,接下来我们需要委托操作系统将消息发送给 Web 服务器。尽管浏览器能够解析网址并生成 HTTP 消息,但它本身并不具备将消息发送到网络中的功能,因此这一功能需要委托操作系统来实现。在进行这一操作时,我们还有一个工作需要完成,那就是查询网...
2018-11-03 16:27:59 1805
原创 网络是怎样连接的(1)
1.1探索之旅从输入网址开始我们的探索之旅从在浏览器中输入网址开始。网址,准确来说应该叫 URL。常见的网址开头有:http:、ftp:、file:、mailto:等等。之所以有各种各样的 URL,是因为尽管我们通常是使用浏览器来访问 Web 服务器的,但实际上浏览器并不只有这一个功能,它也可以用来在 FTP 服务器上下载和上传文件,同时也具备电子邮件客户端的功能。可以说,浏览器是一个具备多种...
2018-11-03 11:58:50 626
原创 PyCharm —— 开发者信息设置
PyCharm 开发者信息设置在团队开发中,需要在代码中编写一些项目信息或个人信息,如开发者、开发时间、项目名称等信息,以利于后期对项目修改和维护。如果每次都需要手动编写,费时费力。下面介绍如何自动在diamante文件中自动生成这些信息。(1)打开 PyCharm 开发环境,在菜单中依次选择 File —> Settings (或使用快捷键:<Ctrl + Alt + S>...
2018-11-02 19:50:47 2096
转载 机器学习系列(12)_XGBoost参数调优完全指南(附Python代码)
1. 简介如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。 构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。所以为了提高模型的表现,参数的调整十分必要。在解决实际问题的时候,有些问题是很难回答的—...
2018-11-02 14:57:26 358
GoogleFileSystem-Bigtable-MapReduce
2018-08-12
统计学经典教材小合集
2017-10-13
深入分析Java Web技术内幕
2017-10-13
CC150(CareerCup)
2017-06-14
《算法新解》中文pdf
2017-02-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人