自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 HTTPS的建立过程(SSL建立安全会话的过程)

前面我们在分析浏览器访问一个页面步骤的时候涉及了HTTP请求响应过程。而HTTP是明文传输的,这就意味着介于发送端和接收端之间的任意节点都可以知道传输的内容是什么,这些节点可以是路由器、代理等。因此,HTTPS出现了,其是以安全为目标的HTTP通道,全称是Hyper Text Transfer Protocal over Secure Socket Layer,即在HTTP之下加入了SSL(安全套...

2018-06-22 17:53:46 20107 6

原创 浏览器访问一个页面的步骤详解

面试时经常被问到:浏览器访问一个页面的时候背后的步骤是怎样的?我往往是把HTTP请求和响应讲了一下。现在想想,感觉仅仅回答HTTP请求和响应有点太窄了。所以,这里主要从计算机网络的角度将浏览器访问一个页面的背后的过程进行一个较为详细的解读。域名->IP当在浏览器中访问一个网址的时候,首先要做的就是找到域名所对应的服务器的IP地址。浏览器通常有三个途径来找IP地址。缓存。包括浏览器的DNS缓存...

2018-06-21 21:57:37 3303

原创 使用Python Flask框架快速实现简单API

下载安装virtualenv(virtualenv用于创建独立的Python环境,多个Python相互独立,互不影响)https://pypi.python.org/pypi/virtualenv 在该地址下载,解压进入解压后目录,执行python setup.py install使用virtualenv安装一个Flask的虚拟环境新建一个目录,mkdir test进入

2017-07-17 10:20:03 1050

原创 使用Python Falcon框架快速实现简单API

Ubuntu下默认装了python2.7装pip(安装python包管理器)sudo apt-get install python-pip装Falcon和gunicorn(gunicorn是一个Python WSGI UNIX的HTTP服务器)pip install --upgrade falconpip install gunicorn新建一个

2017-07-17 10:06:23 5927

原创 3.1 决策树的基本思想

实例:销售调查例子(对潜在客户进行分类,给出销售人员指导意见)销售调查表:销售调查决策树:上面仅是从定性的角度对潜在用户的判断,下面加上定量的判断:决策树的算法框架:决策树的主函数:各种决策树的主函数大同小异,本质上是个递归函数,该函数主要功能是根据某种规则生长出决策树的各个分支节点,并根据终止条件结束算法。输入需要分类的数据集和类别

2017-06-05 19:12:03 14635

原创 2.4 分类算法:KNN

k最近邻(k-Nearest Neighbor)思想:如果一个样本在特征空间中的k个最近邻(最相似)的样本中的大多数都属于某一个类别,则该样本也属于这个类别流程:第一阶段:首先我们事先定下k值(就是指最近邻居的个数)第二阶段:确定的距离度量公式——文本分类一般使用夹角余弦,得出待分类数据点和所有已知类别的样本点中, 选择距离最近的 k 个样本。夹角余弦公式:第三

2017-05-22 11:19:00 339

原创 2.3 分类算法:朴素贝叶斯

贝叶斯公式:朴素贝叶斯分类的正式定义:设 x={a1,a2,…,am}为一个待分类项,而每个 a 为 x 的一个特征属性有类别集合 C={y1,y2,…,yn}计算 P( y1|x) ,P( y2|x),…, P( yn|x)如果 P( yk|x) =max{P( y1|x),P( y2|x),…, P( yn|x)},则 x∈yk因为分母P(x)对于所有类

2017-05-22 11:17:01 332

原创 2.2 文本分类项目

中文语言的文本分类技术和流程:‘预处理:去除文本的噪声信息,例如HTML标签、文本格式转换、检测句子边界等中文分词:使用中文分词器为文本分词,并去除停用词构建词向量空间:统计文本词频,生成文本的词向量空间权重策略——TF-IDF方法:使用TF-IDF发现特征词,并抽取为反映文档主题的特征分类器:使用算法训练分类器评价分类结果:分类器的测试结果分析文本预处理1.选择处理的文本

2017-05-22 11:05:17 2986

原创 2.1 文本挖掘与文本分类的概念

文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。简言之,文本挖掘就是从非结构化的文本中寻找知识的过程。文本挖掘的7个主要领域如下:搜索和信息检索(IR):存储和文本文档的检索,包括搜索引擎和关键字搜索。文本聚类:使用聚类方法,对词汇、片段、段落或文件进行分组和归类。文本分类:对片段、段落或文件进行分组和归类

2017-05-22 11:04:07 3245

原创 AngularJS作用域$scope事件路由与广播

AngularJS作用域支持两种事件传播方式:事件从子作用域路由到父作用域——$emit()事件从父作用域广播到所有子作用域——$broadcast()$on()用于注册监听$scope.$on("infoEvent",function(event,data){ });data为调用$emit()或$broadcast()方法获得的数据event事件对象具有一些实用的属性和

2017-05-19 17:02:42 1308

原创 AngularJS的作用域$scope监视

$watch()使用$watch()方法监视作用域中属性的变化例子:监视&解除监视 change count: {{count}} angular.module('watchModule',[]) .run(['$rootScope',function($rootScop

2017-05-19 16:57:55 559

原创 1.4 数据处理与可视化

数据的导入和内存管理1.数据表文件的读取由于现在大多数系统内存都在几个G,因此小点的数据表处理比较简单,可以直接读入内存并结构化下面例子是用python读取数据表文件,并将其存到矩阵中,并输出矩阵的行、列数# -*- coding: utf-8 -*-import sysimport osfrom numpy import *# 配置utf-8输出环境reload(s

2017-05-19 10:45:57 847

原创 1.3 机器学习的数学基础

相似性的度量样本之间的相似性度量:向量的距离,反映为某类事物在距离上接近或远离的程度,即距离越近的就越相似,越容易归为一类,距离越远就越不同范数:向量的范数可以简单、形象地理解为向量的长度,或者向量到坐标系原点的距离,或者相应空间内两点之间的距离。向量的范数定义:向量的范数是一个函数||x||,满足非负性||x|| >= 0,齐次性||cx|| = |c| ||x|| ,三角不

2017-05-19 00:10:33 379

原创 1.2 对象、矩阵与矢量化编程

对象与维度对象是指含有一组特征的行向量对象的维度就是行向量的列数初识矩阵矩阵式具有相同特征和维度的对象集合,表现为一张二维数据表一个对象表示为矩阵中的一行,一个特征表示为矩阵中的一列,每个特征都有数值型的取值特征相同、取值相异的对象集合所构成的矩阵,使对象之间既相互独立,又相互联系由特征列的取回范围所构成的矩阵空间应具有完整性,即能够反映出事物的空间形式或变化分类或聚类可以

2017-05-17 15:31:32 2049

原创 1.1 编程语言与开发环境

搭建Python开发环境装的ubuntu16里面默认带了python2.7,就不用额外装了安装Python算法库安装python包管理工具pip:sudo apt-get install python-pip安装Python算法库:pip install numpy scipy matplotlib scikit-learnNumPy和SciPy主要用于

2017-05-17 15:24:20 830

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除