自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (12)
  • 问答 (1)
  • 收藏
  • 关注

原创 ndarray.ravel([order]) 和 ndarray.flatten([order])

返回一维数组>>>x = np.array([[1, 2], [3, 4]])>>> x.flatten()array([1, 2, 3, 4])>>> x.ravel()array([1, 2, 3, 4])

2018-04-28 15:36:08 261

原创 d3 选择元素 api

选择添加删除 函数 描述 select 选择一个元素 selectAll 选择多个元素 selection.order 排列选中元素 selection.sort 基于数据排列 selection.filter 过滤选择 selection.empty 是否为空 selection.size 选中...

2018-04-23 10:01:46 820

翻译 d3 数组操作

js数组方法赋值方法 方法 描述 pop 删除末尾元素 shift 删除首位元素 push 末尾添加元素 unshift 首位添加元素 splice 指定位置添加删除元素 reverse 逆序排列 sort 数组排序取值方法 方法 描述 slice 切片...

2018-04-23 09:45:31 4316

原创 python hash表

在查找过程中不经过关键字的比较. 在待查的关键字值和它的存储位置之间建立一个确定的对应关系,则查找时不必再进行关键字值间的比较.根据设定的哈希函数以及处理冲突的方法将查找表中各个数据元素存储在一段有限的连续空间中.即获得哈希表.简单理解把key值通过函数映射为一个数组的下标.python内部的字典数据类型就是hash表实现的.哈希函数方法: 1.直接定址法 H(key)=ke...

2018-04-19 17:12:51 3578

原创 百度 自然语言处理API

接口名称 描述 lexer 分词,词性标注 depParser 句子结构分析 wordEmbedding 转换为词向量 dnnlm 语法分析,看是否符合语言表达习惯 wordSimEmbedding 词语相似度 simnet 文本相似度 commentTag 评论观点抽取 sentiment...

2018-04-18 16:16:39 4680

原创 TF-IDF

词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。 逆向文件频率 (inverse document frequency, IDF)是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。 TFIDF实际上是:TF * IDF TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率...

2018-04-18 15:02:18 436

原创 朴素贝叶斯(naive Bayes) 二

重复词语处理 1.多项式模型(词袋模型) 词语每出现 一次就计数一次 2.伯努利模型(词集模型) 将重复的词语都视为只出现一次 3.在计算句子概率时(训练时),不考虑重复词语出现的次数,但在计算词语概率P(“词语”|c)时(判断时),却考虑重复词语的出现次数工程应用注意事项 1.对数处理,因为乘法运算,计算的时间开销比较大,一般都是先计算出所有可能的结果,然后查表 2.转换权重,...

2018-04-18 11:10:02 267

原创 神经网络(二)

训练样本有m个,输入为x,输出为y,L表示神经网络的层数,SlSlS_l表示每层neuron个数,SLSLS_L表示输出层神经元个数,k也可以表示为输出层神经元的个数. 相比逻辑回归里的代价函数,其实就是多了多分类加和.梯度下降法,使得代价函数最小 神经网络总结 ...

2018-04-16 10:10:10 295

原创 jQuery 事件方法(交互)

方法 描述 change() 改变 click() 单击 dblclick() 双击 focus() 当通过鼠标点击选中元素或通过 tab 键定位到元素时 focusin() 当元素(或在其内的任意元素)获得焦点时发生 focusin 事件 focusout() 当元素(或在其内的任意元素)失去焦点时发生 fo...

2018-04-12 09:50:16 269

原创 D3 二次方曲线与切线

数据生成import jsondic = [{"x":i,"y":0.01*i*i} for i in range(-150,150,1)]json.dump(dic,open("./test.json","w"))d3展示<html><style>.axis path,.axis line{ fill: none; stroke: b

2018-04-10 18:19:03 792

原创 D3 折线图

<html><style>.axis path,.axis line{ fill: none; stroke: black; shape-rendering: crispEdges;}.axis text { font-family: sans-serif; font-size: 11px;}path { fill:...

2018-04-10 13:47:12 1438

原创 D3 加载数据

在加载数据之前先启动一个http服务python -m http.server1.加载csv数据错误示范 dataset异步被加载而不能及时使用,详见参考文献. Which is a aync call so initially nodes will be undefined because var nodes; gives nothing to it. During the ...

2018-04-10 11:00:45 1696

原创 http.server模块

class http.server.HTTPServer(server_address, RequestHandlerClass) class http.server.BaseHTTPRequestHandler(request, client_address, server) class http.server.SimpleHTTPRequestHandler(request, client...

2018-04-10 10:48:45 802

原创 SVG元素

D3 最适合用来生成和操作 SVG(Scalable Vector Graphics,可伸缩矢量图形)创建svg画布var w = 500;var h = 50; //以后可以用来居中.attr("cy", h/2)var svg = d3.select("body") //选择文档中的body元素 .append("svg") //添加一个sv...

2018-04-10 10:26:01 513

原创 D3 交互

<html> <body> <script src="http://d3js.org/d3.v3.min.js" charset="utf-8"></script> <script> var width = 300; //画布的宽度 var

2018-04-10 08:59:04 346

原创 D3 动态效果

transition().attr("fill","red") //初始颜色为红色.transition() //启动过渡.attr("fill","steelblue") //终止颜色为铁蓝色duration() 指定过度时间,单位毫秒delay() 延迟 duration(2000)ease() 过度方式,”li...

2018-04-09 16:39:26 2365

原创 D3 Update,Enter,Exit

enter<html> <body> <p>1</p> <script src="http://d3js.org/d3.v3.min.js" charset="utf-8"></script> <script>

2018-04-09 16:24:37 369

原创 D3 数轴

在 SVG 画布的预定义元素里,有七种基本图形:矩形,圆形,椭圆,线段,折线,多边形,路径. SVG还有g标签,意思是分组,group,可以将其他的容器进行组合.调用数轴函数并不会返回值,而是会生成数轴相关的可见元素,包括轴线、标签和刻度。var xAxis = d3.svg.axis();xAxis.scale(xScale); // 传入比例尺xAxis.orient("bo...

2018-04-09 16:08:58 787 1

原创 D3 比例尺

D3 中的比例尺,定义域(domain)值域(range)会是一一对应的关系.使用比例尺可以根据盒子的大小来自适应图片的大小.var linear = d3.scale.linear()线性比例尺var dataset = [0,1,2,3,4,5,6,7,8,9];var min = d3.min(dataset);var max = d3.max(dataset);var...

2018-04-09 15:46:21 603 2

原创 D3 绘制矩形

<html> <body> <script src="http://d3js.org/d3.v3.min.js" charset="utf-8"></script> <script> var width = 300; //画布的宽度 var

2018-04-09 15:38:52 4470

原创 D3 插入删除元素元素

插入元素 append():在选择集末尾插入元素 insert():在选择集前面插入元素<html> <body> <p>1</p> <p>2</p> <script src="http://d3js.org/d3.v3.min.js" ch

2018-04-09 15:32:00 2739

原创 D3 datum&data

data()与datum() 在选择元素后(selcetAll)后,直接调用.data方法绑定数据. data绑定的是数组常用 datum绑定的是一个数,不常用在连缀方法中,只要调用 data() 了,就可以随时创建一个接收 d 为输入的匿名函数。与当前元素对应,方法 data() 确保了每个 d 都会被赋予原始数据集中的一个值。 随着 D3 遍历每个元素,“当前元素”的这个值也会跟着...

2018-04-09 15:25:51 2185

原创 D3

SVG元素d3 select选择器 D3 插入删除元素元素 D3 绘制矩形 D3 加载数据 D3 Update,Enter,Exit D3 绑定数据 D3 比例尺 D3 刻度 D3 交互D3 svg text标签控制api d3 数组操作 d3 选择元素 api例子: D3 折线图 D3 二次方曲线与切线...

2018-04-09 15:16:49 362

原创 D3 select&selectAll

<html> <body> <p>hello world</p> <script src="http://d3js.org/d3.v3.min.js" charset="utf-8"></script> <script&

2018-04-09 15:16:06 11219

原创 phantomjs

Win 官网下载http://phantomjs.org/download.html 安装后配置环境变量。Linuxtar -xvf phantomjs-2.1.1-linux-x86_64.tar.bz2 mv phantomjs-2.1.1-linux-x86_64 /usr/local/share/phantomjs ln -s /usr/local/share/phant...

2018-04-09 09:36:23 215 2

原创 python 关键字

关键字 含义 FALSE 布尔类型的值,表示假,与 True 相反 TRUE 布尔类型的值,表示真,与 False 相反 None 表示什么也没有,在逻辑判断中被当成False。 assert 断言,用于判断变量或者条件表达式的值是否为真 in 判断变量是否在序列中 is 判断变量是否为某个类的实例 a...

2018-04-08 13:21:15 2573

原创 神经网络

神经网络可以解决当特征太多,计算负荷过大的问题.比如在处理图像问题时,一张图片每一个像素都是一个特征,用神经网络就比较合适. 神经网络起源于80~90年代,但是在90年代后期就减少了.而现在神经网络又再次兴起,原因是计算机运行速度变快,解决了神经网络计算量偏大的问题. 每个神经元都可以被认为是一个处理单元/神经核(processing unit/ Nucleus),它含有许多输入/树突(inp...

2018-04-08 11:59:19 426

原创 机器学习 正则化(regularization)

方法 1.丢弃一些特征,手工或者使用一些算法(如PCA) 2.正则化,保留特征,但是减少参数大小.正则化 高次项导致了过度拟合,所以只要将高次项的系数逼近为0的话,就可以拟合了,既在一定程度上减少参数θθ\theta的值. 其中λλ\lambda称为正则化参数(regularization parameter),根据惯例,不需要对θ0θ0\theta_0进行惩罚. 正则化线性...

2018-04-04 16:33:46 2088

原创 机器学习 线性回归

梯度下降实现线性回归 求导 最终算法: 多变量线性回归 基础知识 n 代表特征数量 x(i)x(i)x^{(i)}代表第i个训练实例,是特征矩阵中的第i行,是一个向量(vector) x(i)jxj(i)x^{(i)}_j代表特征矩阵中第i行的第j个特征,也就是第i个训练实例的第j个特征.多变量假设模型hθ(x)hθ(x)h_\theta(x) 也可以用向量表示...

2018-04-04 16:12:59 391

原创 机器学习 基础知识

m 代表训练集(training set)中实例的数量 x 代表特征(feature)/输入(input) 变量 y 代表目标(target)/输出(output) 变量 (x,y) 代表训练集中的实例 (x(i),y(i))(x(i),y(i))(x^{(i)},y{(i)})代表第i个观察实例 h代表学习算法的模型,也称假设(hypothesis),hθ(x)=θ0θ1xhθ(x)=...

2018-04-04 14:15:49 832

原创 apscheduler

基础概念 触发器(trigger)和保存调度逻辑. 作业存储(job store),默认存储在内存中,也可以保存在数据库中(使用序列化和反序列化实现) 执行器(executor)控制执行的作业 调度器(scheduler)包含以上三者 选择合适的调度器,存储,执行和触发器 名称 描述 BlockingScheduler 当在进程中使用时 Backgr...

2018-04-04 11:34:59 646

opencv_yolo3.part1.rar

opencv和yolo3的结合,因为需要用到权重等文件,比较大,所以分开打包,这是part1.

2019-08-20

opencv_yolo3.part2.rar

opencv和yolo3的结合,因为需要用到权重等文件,比较大,所以分开打包,这是part2.

2019-08-20

IDE直接和hadoop集群连接

hadoop可以使用IDE直接和集群连接,这样就可以直接在ide里进行测试了

2019-03-20

Win本地测试hadoop

Windows本地来测试hadoop的文件,方便进行快速的开发和迭代

2019-03-20

Linux提交hadoop任务

linux上传hadoop任务,总共包含了三个文件,分别是mapper,reducer,和jobsubmitter

2019-03-20

tesseract软件包

tesseract开发的工具包,包含了tesseract安装包,字体训练工具,以及一些验证码的样例

2018-10-10

java8安装包jdk-jre

-java8的开发环境

2018-10-10

文本挖掘资源

https://catalog.data.gov/dataset/consumer-complaint-database

2018-04-18

utf-8 unicode编码表

所有的utf-8 unicode编码,都可以在表里面查询,方便进行文本处理.

2018-03-26

linux tmux原版参考手册

tmux 英文参考手册

2017-06-14

iris数据集

博客里用到的数据集

2017-02-26

2016最新中国行政区划分

来源:国家统计局设管司 发布时间:2016-08-09 11:28 发布地址:http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201608/t20160809_1386477.html 解压密码:http://blog.csdn.net/claroja 如有其他问题可以给我留言,或者联系我的QQ:63183535,亲手制作!

2016-12-12

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除