自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

藏知阁

以文会友

  • 博客(107)
  • 资源 (2)
  • 收藏
  • 关注

原创 [Windows开发] 用C++创建第一个窗口程序

Win32 API(也称为Windows API)是Windows比较原生态的C++ API。#ifndef UNICODE#define UNICODE#endif#include <windows.h>LRESULT CALLBACK WindowProc(HWND hwnd, UINT uMsg, WPARAM wParam, LPARAM lParam);int WINAPI wWinMain(HINSTANCE hInstance, HINSTANCE, PWSTR

2020-10-30 04:00:02 386

原创 Stanford CoreNLP 3.6.0 使用入门

Stanford CoreNLP由Java语言开发,是斯坦福大学自然语言处理小组的研究成果。 包含自然语言处理的基本任务:分词、词性标注、依存句法分析、命名实体识别等等,支持多语言。项目地址:GitHub本文主要记录使用注意事项。Stage 1首先我们要下载 CoreNLP Java包。 然后在Eclipse里面的Classpath里面引入jar文件。如下图红色框所示: CoreNLP只需

2020-10-01 17:03:06 12931 7

原创 [TensorFlow 2.0] Keras三种搭建模型的方式——序列式、函数式、Model子类

数据集:# coding = utf-8import numpy as npimport tensorflow as tffrom tensorflow import keras# Prepare data X_train: ndarray,(60000, 28, 28) y_train: ndarray, (60000,)(X_train, y_train), (X_valid, y_valid) = keras.datasets.fashion_mnist.load_data()X_t

2020-05-31 18:55:18 429

原创 B+树

MySQL中B+树和B树的不同之处:1、非叶节点如果有k个元素,则必有k个孩子节点;2、所有父节点元素都同时存在于子节点元素中,在子节点元素中是最大或最小的元素;3、所有的叶子节点包含了全部元素,且从小到大排序,节点间用指针链接起来。例子,下面是[1, 2, 3, 5, 6, 8, 9, 11, 13, 15]构成的一棵B+树:参考:[1] 漫画:什么是B+树?...

2020-02-13 18:52:33 153

原创 B树

MongoDB索引主要用的数据结构是B树。B树(Balance Tree,B-Tree),是一棵多路平衡查找树。一个m阶的B树具有如下几个特征:1、根节点包含的元素数量范围:1≤k≤m−11 \le k \le m-11≤k≤m−1;比如5阶B树,1≤k≤41 \le k \le 41≤k≤42、非根节点包含的元素数量范围:m/2≤k≤m−1m/2 \le k \le m-1m/2≤k≤m...

2020-02-13 18:11:35 447

原创 PuLP—线性规划高级例子

文章来自Optimization Modeling in Python: PuLP, Gurobi, and CPLEX,加入个人见解。问题:min∑i=1n∑j=1mcijxijs.t.∑i=1naijxij≤bj∀jxij≥lij∀i,jxij≤uij∀i,j\begin{aligned}& min& \quad \sum_{i=1}^{n} \sum_{j=1}^{...

2020-02-11 13:58:18 332

原创 使用高斯混合模型进行聚类

如下图所示是600个数据点:生成模拟数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.mixture import GaussianMixturen_samples = 300# generate random sample, two componentsnp....

2020-01-20 19:19:03 383

原创 随机森林可视化

环境:Windows 10,Python 3.7首先需要安装Graphviz,这里我们使用的是graphviz-2.38.msi,安装在D:\Program Files (x86)\Graphviz2.38。代码:import osfrom sklearn.datasets import load_irisfrom sklearn.ensemble import RandomForest...

2019-09-22 10:50:22 2125

原创 手撕随机森林的超参数

from sklearn.ensemble import RandomForestRegressor# 默认参数model = RandomForestRegressor(n_estimators=10, criterion="mse", max_depth=None, min_samples_split=2, min_...

2019-09-20 10:15:51 1373

原创 基于遗传算法的车辆路径规划问题

pointdemandxyn12.3-57n21.60-10.1n3n4n5n6n7n8n9总共有9个点,简单起见,我们编号为1、2、…、9,起点编号为0。一个方案就是一个个体(Individual),比如下面是三个个体:个体编码Individ...

2019-09-09 01:36:50 6900 2

原创 单纯型

maxz=2x1+3x2+x3s.t.x1+x3=5x1+2x2+x4=10x2+x5=4xj≥0,j=1,2,⋯&ThinSpace;,5\begin{aligned}max \quad &amp; z=2x_1+3x_2+x_3 \\s.t. \quad &amp; x_1 + x_3 = 5 \\&amp; x_1 + 2x_2 +x_4 = 10...

2019-08-12 21:29:10 55

原创 谷歌OR-Tools解决车辆路径规划问题笔记

RoutingIndexManagerRoutingModelrouting.IsVehicleUsed(assignment, vehicle_id)返回布尔型,表示该车是否被使用。AssignmentAssignment是一个"变量 -> 域"的映射,用来输出与解相关的信息。...

2019-06-20 13:58:22 2245

原创 PuLP—整数规划例子

一个简单的整数规划问题:\begin{equation}\begin{aligned}& max & \quad x+y+2z \& s.t. & \& \quad & x+2y+3z \le 4 \& \quad & x+y \ge 1 \& \quad & x,y,z \quad binary\...

2019-05-08 14:11:26 1986 5

原创 PuLP—查询本地已安装好的优化器

PuLP支持多种优化器进行运算,查询优化器是否可用代码:# coding=utf-8from inspect import getmembersimport pulpfor m in getmembers(pulp.solvers): try: if isinstance(m[1], type): print('--', m[1]().a...

2019-05-08 11:55:20 1156 2

原创 预测评价指标RMSE、MSE、MAE、MAPE、SMAPE

RMSE均方根误差(Root Mean Square Error)MSE均方误差(Mean Square Error)MAE平均绝对误差(Mean Absolute Error)MAPE平均绝对百分比误差(Mean Absolute Percentage Error)...

2019-02-21 10:50:31 97433 25

原创 使用XGBoost进行时间序列预测流程代码

原始数据也就是两列数据,一列是时间,一列是电力消耗量:Datetime,PJME_MW2002-12-31 01:00:00,26498.02002-12-31 02:00:00,25147.02002-12-31 03:00:00,24574.02002-12-31 04:00:00,24393.02002-12-31 05:00:00,24860.02002-12-31 06:...

2019-02-20 21:52:01 10550 2

原创 Python生成requirements.txt文件

参考使用自带pip$ pip freeze &amp;gt; ./requirements.txt这种方法缺点是会把环境中所有安装的包都包括进来。使用pipreqs包安装$ pip install pipreqs在项目根目录下,使用$ pipreqs ./这种方法根据项目的import语句来生成依赖,比pip方法简洁,但是不是很精准,有些深层依赖可能不会添加进来。该命令默认联网PyPi...

2019-02-20 11:55:01 2570

原创 Redis入门

常用命令哨兵服务器连接$ ./redis-cli -h 192.168.0.1 -p 8001查看信息$ 192.168.0.1:8001&amp;gt; info# Serverredis_version:2.8.19redis_git_sha1:00000000redis_git_dirty:0redis_build_id:1d8f61a4688b7851redis_mode...

2019-02-19 18:09:01 46

原创 使用Impyla连接Hive

依赖:sasl-0.2.1six-1.12.0thrift-0.11.0thrift-sasl-0.3.0安装sasl时报错:sasl/saslwrapper.h:22:10: fatal error: sasl/sasl.h: No such file or directory使用sudo apt-get install libsasl2-dev安装libsasl2-dev即可。...

2019-02-18 15:50:40 531

原创 Python多进程多线程详细剖析

主要涉及的模块:threadingmultiprocessingconcurrent.futures

2019-02-15 13:46:19 80

原创 使用PyHive连接Hive数据仓库

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask. Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name and the correspond ser...

2019-02-13 15:26:22 5665

原创 TensorFlow笔记——常用运算函数解析

1. 矩阵乘法 tf.matmul(a, b, transpose_a=False, transpose_b=False, adjoint_a=False, adjoint_b=False, a_is_sparse=False, b_is_sparse=False, name=None)函数实现了数学上的矩阵乘法,最简单的二维例子:a = np.array([[1, 2], [3,

2019-02-12 16:51:15 196

原创 Pandas各种骚操作

找出NaN值的位置:df.isnull().stack()[lambda x: x].index.tolist()

2019-01-08 20:28:39 814

原创 论文解读—Deep Multimodal Hashing with Orthogonal Regularization

占坑

2018-12-19 14:39:41 301

原创 Docker常用命令

# docker build# docker build -t prediction-api .镜像管理保存和加载# docker save -o myimage.tar myimage# docker load myimage.tar容器管理

2018-11-09 11:17:57 176

原创 使用Supervisor和Gunicorn部署Flask应用入门

最简单的Flask Web应用:myapp.pyfrom flask import Flaskapp = Flask(__name__)@app.route('/')def index(): return 'Hi! It works!'if __name__=='__main__': app.run(host='0.0.0.0')想启动该应用,只要运行pyt...

2018-11-09 11:08:47 3540 3

原创 Hive之常用运算符和函数

用户手册日期函数int datediff(string enddate, string startdate)返回从startdate到enddate的天数。例子:hive&amp;amp;gt; select datediff('2009-03-01', '2009-02-27') # 2分析函数ROW_NUMBER() OVER(PARTITION BY column_nam...

2018-11-07 14:17:03 1924

原创 HBase入门基本:命名空间、建表、增删改查

进入HBase数据库# hbase shell注意HBase Shell 中的回格键没用,要用【Ctrl+Backspace】,每个命令之后不需要分号(;)结束。HBase帮助命令:hbase&amp;amp;amp;amp;amp;amp;amp;amp;amp;gt; help 'create'命名空间列出所有命名空间hbase&amp;amp;amp;amp;amp;amp;amp;amp;amp;gt; list_namespace新建命名

2018-11-02 16:14:08 52522

原创 Hive高级教程

set hive.groupby.skewindata=true;当HQL语句中有GROUP BY时,默认情况下,Hive将具有相同分组键的数据放入同一个Reducer。如果分组键的不同值具有数据倾斜,则一个Reducer可能会获得大部分数据,与其他Reducer相比,这个Reducer需要更长的时间才能完成。通过设定set hive.groupby.skewindata=true;,Hi...

2018-09-29 15:36:56 161

原创 Hive入门基本:建表、增删查改

最基本的建表语句:create table student(id string comment '学号',name string comment '姓名',sex string comment '性别',age string comment '年龄') comment '学生表';show create table student;CREATE TABLE `student`(...

2018-09-27 15:58:50 3184

原创 Ubuntu 18.04 Anaconda使用

Anaconda官网下载学过Python的估计都知道virtualenv可以用来创建Python的虚拟环境,然而它的一个缺点是难以指定Python的确切版本,比如电脑只安装了Python 3.6,那我们就只能以Python 3.6为基础环境,然后安装任意版本的第三方包。Anaconda和virtualenv类似,也是用来创建Python的虚拟运行环境,但它的优点就是可以指定任意版本的Pyt...

2018-09-11 11:28:58 6192

原创 Gurobi之Python调用实例——简单整数规划

一个简单的整数规划问题: maxs.t.x+y+2zx+2y+3z≤4x+y≥1x,y,zbinary(78)(78)maxx+y+2zs.t.x+2y+3z≤4x+y≥1x,y,zbinary\begin{equation}\begin{aligned}& max & \quad x+y+2z \\& s.t. & \\& \quad & x+2y+3z \le 4 \\& \q...

2018-09-10 23:46:26 9662 1

原创 大数据基本组件(Hadoop、HDFS、MapRed、YARN)入门命令

HDFS、MapRed、YARN是Hadoop大数据的基础组件,安装好Hadoop之后,这些组件自然包含在里面。正常安装Hadoop之后,通常可以通过环境变量$HADOOP_HOME知道Hadoop的安装位置: $ echo $HADOOP_HOME切换到Hadoop的安装目录,就可以愉快地使用hadoop、hdfs、mapred、yarn命令啦。Hadoop常用命令We...

2018-08-28 09:41:44 1029

原创 [LeetCode] 01 Matrix

题目:01矩阵思路:首先想到的就是穷举遍历的方法了,不过穷举也有点规律。 我们以矩阵中的一个1为例,如下图,有颜色的的格子的数字表示距离,每一层也都是正方形,只不过这个正方形旋转了45°。 麻烦的地方在于数组下标的确定,对于每一层,可以先确定上下左右4个点,然后根据上点和下点确定其余的点。假设当前点位置为:iii,jjj对于每层lll: 上:i−li−li-l,jjj...

2018-04-28 10:22:14 170

原创 语义角色标注入门

语义角色标注(Semantic Role Labeling)的目标主要是识别出句子中Who did What to Whom, When and Where。英文数据集主要有CoNLL-2005和CoNLL-2012提供的标注数据集,其中CoNLL-2005的数据集来源于Penn Tree Bank,CoNLL-2012的数据集来源于OntoNotes v5.0。然而,PTB和OntoNote...

2018-04-26 23:50:45 1421 2

原创 解码之Beam Search算法

解码是seq2seq模型的常见问题,常用方法有贪心搜索(Greedy Search)集束搜索(Beam Search)。简单贪心搜索 From [1]如图,Decoder根据Encoder的中间语义编码向量ccc和&lt;s&gt;标签得到第一个输出的概率分布[0.1,0.1,0.3,0.4,0.1][0.1,0.1,0.3,0.4,0.1][0.1, 0.1, 0.3, 0.4, ...

2018-04-14 11:49:24 5586

原创 [TensorFlow笔记] GPU环境搭建

系统:Ubuntu 16.04安装首先要下载NVIDIA公司提供的两个文件:CUDA(下载地址)和cuDNN(下载地址),下载需要注册账号,有点坑爹。CUDA建议下载runfile(local)文件类型,cuDNN要同时下载Runtime和Development两个deb包。注意一定要下载匹配TensorFlow的版本,如下: TensorFlow版本 CUDA...

2018-04-06 17:46:19 443

原创 论文解读—Head-Lexicalized Bidirectional Tree LSTMs

从题目就可以明确看出,在Tree LSTMs的基础上,贡献有两点:Head-Lexicalized,增加了短语的中心词(Head Word)信息Bidirectional,基本的树形LSTM是自底向上(Bottom-up)构建一棵树的,论文增加了自顶向下(Top-down)的计算机制Head Word(a)图是一般的Tree LSTM,(b)图是增加了中心词信息的Tree L...

2018-04-01 12:56:44 1321 1

原创 手撕t-SNE算法

t-SNE(t-Distributed Stochastic Neighbor Embedding)即t分布随机邻近嵌入,类似于PCA,是一种数据降维方法,与PCA不同的是,它是非线性的。SNE假设我们的原始数据矩阵为X∈Rn×mX∈Rn×m\mathbf{X} \in \mathbb{R}^{n \times m},降维后的矩阵为Y∈Rn×2Y∈Rn×2\mathbf{Y} \in ...

2018-03-29 14:39:28 899 4

原创 相对熵(KL散度)计算过程

KL散度(Kullback-Leibler Divergence)也叫做相对熵,用于度量两个概率分布之间的差异程度。离散型DKL(P∥Q)=∑i=1nPilog(PiQi)DKL(P∥Q)=∑i=1nPilog(PiQi)D_{KL}(P \parallel Q)= \sum_{i=1}^{n}P_i log(\frac{P_i}{Q_i})比如随机变量X∼PX∼PX \sim...

2018-03-29 00:59:41 13653 1

LoaderManagerExample

LoaderManagerExample

2014-09-25

Android源码下载工具repo

下载Android源码必须工具 version 1.21

2015-01-08

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除