- 博客(92)
- 资源 (4)
- 收藏
- 关注
原创 深度学习 —— 使用 gensim 实现 word2vec
在自然语言处理领域中,将单词(words)或词语(phases)映射到向量空间(vector space)中可以很容易就得到单词之间的相似度,因为向量空间中两个向量的相似度很容易求得,比如余弦相似度。1. word2vecword2vec:一种无监督深度学习方法,顾名思义,其能实现从 words (来源于一个很大的文本语料库)到 vector 转化,称之为 word embedd
2017-05-28 22:17:15 1690
原创 sklearn preprocessing 数据预处理(OneHotEncoder)
hot encoder 不仅对 label 可以进行编码,还可对 categorical feature 进行编码:
2017-05-28 19:19:04 28794 5
原创 中英文对照 —— 饮食与美食
1. 五味甜: syrup:n. 糖浆,果汁;含药糖浆酸: ketchup:番茄酱;2. 肉食mutton:n. 羊肉pork:n. 猪肉beef:n. 牛肉;
2017-05-27 19:07:27 1219
原创 powerpoint(ppt) 的制作
1. 幻灯片母版首先,幻灯片母版在菜单栏的【视图】选择【幻灯片母版】显示和查看。通过幻灯片母版的编辑和设计,可进一步:在幻灯片的相关位置,添加如 logo、时间、日期(报告人)、背景图片等页面信息;
2017-05-25 15:55:27 864
原创 libsvm 的使用
1. libsvm 支持的SVM模型官网地址:LIBSVM – A Library for Support Vector Machineslibsvm 支持的 SVM 模型如下
2017-05-25 15:19:15 1803
原创 TFRecord —— tensorflow 下的统一数据存储格式
tensorflow 提供了统一的数据存储格式,即 TFRecord(record 表示记录),以提高程序的可扩展性,当数据来源十分复杂时,仍能有效记录输入数据中的信息。1. tfrecord 使用流程比如对于 mnist 训练数据集,我们要将其 label 和像素内容以 TFRecord 的形式写入到本地。
2017-05-25 10:33:59 1847
原创 Python str 与 bytes 类型(Python2/3 对 str 的处理)
本文均在 Python 3 下测试通过,python 2.x 会略有不同。1. str/bytes>> s = '123'>> type(s)str>> s = b'123'bytes2. str 与 bytes 之间的类型转换python str与bytes之间的转换str 与 bytes 之间的类型转换如下:str ⇒ bytes:bytes(s, encoding='utf8')
2017-05-24 17:34:14 30453
原创 分贝(dB)的计算与理解
分贝(dB,decibels)表达的是功率比(power ratio,P2/P1P_2/P_1),而不是一个amount,P2>P1P_2>P_1,分贝为正值,否则为负值。分贝是对数形式的,而不是线性形式的,也即 20 dB 对应的功率比不是 10 dB 功率比的二倍。基本上可推知其定义式如下:
2017-05-23 10:08:53 8097
原创 学习 shell —— 编写基本脚本
set:查看环境变量;0. 简单说明一般而言,shell 会通过 PATH 变量来查找命令,如果要执行用户编写的脚本(未添加进 PATH 路径),还需两步操作:需要 $ ./xx为需执行该脚本的用户增加执行权限:chmod u+x xx(chmod o+x xx)1. 简单用法将通过 echo输出的文本字符串和后续的命令执行输出不换行:
2017-05-22 22:46:31 1055
原创 从 dig(nslookup) bind —— windows 下的域名解析服务器信息的查看
dig(domain information groper,之所以选择这三个词,在于这三个词的首字母构成的词 dig 也有探索挖掘的含义)本身是 Linux 下的查询 DNS 信息的工具,功能类似 nslookup(name server lookup),但更强大。windows 下仅提供了 nslookup,如果想使用 dig 命令,需手动安装。
2017-05-21 17:32:06 1677
原创 【常识】—— 生物学
0. 被子植物被子植物 门(学名:Angiospermae)是植物界最大和最高级的一类。是种子外有果皮包被的植物。1. 自花授粉与异花授粉自花授粉:指一株植物的花粉,对同一个体的雌蕊进行授粉的现象。在两性花的植物中,又可分为同一花的雄蕊与雌蕊间进行受粉的同花受粉(菜豆属)和在一个花序(个体)中不同花间进行受粉的邻花受粉(gei-tonogany),以及同株不同花间进行受粉的同株异花受粉。被子植
2017-05-20 12:49:46 1024
原创 ubuntu 分屏工具
本文提到的分屏工具,均可通过sudo apt-get install的方式进行安装;基本:terminator高级:tmux,screen还可进一步使用:ctrl + superkey + 方向键,进行排列和展示。
2017-05-20 12:28:46 3051
原创 Inception V3 的 tensorflow 实现
首先来看 Inception V3 的模型架构图: 共 46 层,由 11 个 Inception Modules (模块,图中类似圆角矩形圈出的部分)构成, 如上图示,所谓的一个 Inception Module 即是对同一个输入,分别执行不同的卷积、池化等操作,最终将这些得到的输出 concat(拼接)出一个层次极深的网络;拼接时,如何保证各个操作的输出矩阵大小一致呢(深度可以不同
2017-05-19 19:14:16 4940
原创 TensorFlow 语法及常用 API
1. tf.nn.conv2d 的参数padding=’SAME’ ⇒ 卷积之前的大小和卷积之后的大小一致,默认使用全 0 填充;padding=’VALID’ ⇒ 也即仅适用其有效部分,而不使用填充其他值;
2017-05-19 18:27:55 1395
原创 中英文对照 —— 概念的图解
1. 物理光学: incident ray:入射线,angle of incidence :入射角;reflected ray:反射线,angle of reflection:反射角;normal:法线;
2017-05-16 17:32:04 1574
原创 matlab 时频分析(短时傅里叶变换、STFT)
短时傅里叶变换,short-time fourier transformation,有时也叫加窗傅里叶变换,时间窗口使得信号只在某一小区间内有效,这就避免了传统的傅里叶变换在时频局部表达能力上的不足,使得傅里叶变换有了局部定位的能力。
2017-05-16 11:38:17 54374
原创 酉矩阵(unitary matrix)
复方阵 UU 称为酉矩阵,如果满足:U∗U=UU∗=IU^*U=UU^*=I换句话说,矩阵 UU 的共轭转置 U∗U^* 就是 UU 的逆矩阵。U∗=U−1U^*=U^{-1}1. unitary matrix 保持内积不变⟨Ux,Uy⟩=⟨x,y⟩
2017-05-15 23:41:19 11052
原创 Toeplitz matrix 与 Circulant matrix
之所以专门定义两个新的概念,在于它们特殊的形式,带来的特别的形式。1. Toeplitz matrix对角为常数;n×nn\times n 的矩阵 AA 是 Toepliz 矩阵当且仅当,对于 Ai,jA_{i,j} 有:Ai,j=Ai+1,j+1=ai−jA_{i,j}=A_{i+1,j+1}=a_{i-j}⎡⎣⎢⎢⎢⎢⎢⎢afghibafghcbafgdcbafedcba⎤⎦⎥⎥⎥⎥⎥⎥
2017-05-15 19:12:08 5649
原创 cmake 常见问题及解决
1. undefined reference to symbol ‘pthread_key_delete@@GLIBC_2.2.5未定义对某符号的引用,该错误为链接时(linking)发生的错误。有如下方式的解决方案:修改 Makefile 文件,为变量 LDFLAGS加入,-L /lib64 -l pthread; 通过TARGET_LINK_LIBRARIES(... -lpthread -
2017-05-14 22:43:18 4580
原创 windows 常见环境变量(%AppData%、%TEMP%、%TMP%)
%AppData%、%TEMP%、%TMP% 、%LocalAppData%三个环境变量:C:\Users\hasee>echo %appdata%C:\Users\hasee\AppData\RoamingC:\Users\hasee>echo %TEMP%C:\Users\hasee\AppData\Local\TempC:\Users\hasee>echo %TMP%
2017-05-14 16:33:20 6406
原创 SAR(遥感、卫星) 图像常用数据集
Brazilian Coffee Scenes 数据集较小,5MB左右;UC Merced Land Use Dataset(数据集规模较大,300MB+)MSTAR public targets dataset(需要注册,注册较为简单)
2017-05-14 10:49:36 32909 5
原创 卷积神经网络的权值参数个数的量化分析
考虑 103×10310^3\times 10^3 的输入图像:全连接,隐层神经元的数目为 10610^6 时,则每一个输入像素与每一个隐层神经元之间都是待学习的参数, 数目为 106×106=101210^6\times 10^6=10^{12}卷积,卷积核的大小为 10×1010\times 10 时, 步长为 10,103×10310×10×(10×10)\frac{10^3\time
2017-05-14 10:32:23 6054
原创 Torch 的安装与基本用法
本文安装仅限 ubuntu 系统。官方文档见:Getting started with Torch。1. 安装进入命令行终端,分别执行下面三行的代码,git clone https://github.com/torch/distro.git ~/torch --recursivecd ~/torch; bash install-deps;./install.shinstall.sh脚本会自动将
2017-05-13 22:43:00 1933
原创 操作系统的 (program)loader(程序加载器)
在计算机科学中,加载器(也叫程序加载器)属于操作系统的一部分,用于加载程序(programs)和库(libraries)。加载器是执行程序和代码必不可少的组件,正是它负责将程序送入内存,为程序的运行提供准备。加载的工作一旦完成,操作系统才会移交控制权给被加载的程序代码以执行该程序。嵌入式系统无需加载器,代码可直接在 ROM 中执行。特别地,为了加载操作系统本身,在 booting(自举)的过程中,还
2017-05-13 22:31:54 3921
原创 linux/unix 基本概念的认识(sha-bang 、PPA)
PPA:Personal Package Archives : Ubuntu;比如为安装 emacs,需要首先添加某个PPA:sudo add-apt-repository ppa:cassou/emacssudo apt-get update1. Shabang 称 # 为 sharp,称 ! 为 bang在计算机科学中,Shebang 也称为 Hashban...
2017-05-13 22:12:34 1886
原创 【单词】常见单词含义的辨异(emulator/simulator、hardware/firmware)
1. emulator 与 simulatorThe Simulator tries to duplicate the behavior of the device.(仿真的是行为); The Emulator tries to duplicate the inner workings of the device.(仿真的是内部工作原理;)An emulator can replace the
2017-05-13 21:47:15 1017
原创 R 语言下常用第三方库的说明
1. doBy官方文档见 CRAN - Package doBydoBy 主要适用于以下操作:1) Facilities for groupwise computations of summary statistics and other facilities for working with grouped data: ‘do’ something to data stratified ‘by’
2017-05-13 18:09:53 1609
原创 单位阶跃函数(Heaviside/unit step function)—— 化简分段函数
注意,单位阶跃函数一种不连续函数。1. 常见定义最经典的定义来自于 Ramp function(斜坡函数,max{x,0}\max \{x,0\})的微分形式;
2017-05-13 17:20:20 18747
原创 Python 标准库 csv —— csv 文件的读写
csv 文件,逗号分割文件。1. 写入并生成 csv 文件注意这里是写入并生成,而非创建并写入,也即可自动创建一个不存在的 csv 文件。
2017-05-12 23:20:59 3952
原创 matlab (.m)文件生成 windows 可执行(.exe)文件
mex -setup:设置 C 语言编译器;(如果本地安装有 visual studio 20xx 集成开发环境,则会自动选择其下的 C/C++ 编译器 )将运行时环境(runtime environment)所需要的动态链接库(.dll)添加进系统环境变量(Path),比如对于安装在 D 盘的 matlab 2016,动态链接库所在的路径为;D:\Program Files\MATLAB\R20
2017-05-10 17:35:26 12759
原创 GPU-Z:显卡体质、显卡各传感器实时状态的查看
1. TechPowerUp GPU-Z:查看显卡体质下载地址:Download TechPowerUp GPU-Z | techPowerUp 点击 bus interface 后的?进行显卡的体质测试;现在测试体质 找到gpu上面的窗口 右击,选中 read aisc…. 就可以看到自己显卡的体质2. sensors 选项卡:显卡传感器参数的实时性变化
2017-05-10 10:21:09 8720
原创 Linux 内存管理与系统架构设计
Linux 提供各种模式(比如,消息队列),但是最著名的是 POSIX 共享内存(shmem,shared memory)。 Linux provides a variety of schemes (such as message queues), but most notable is POSIX shared memory (shmem). 1. memory overcommit ...
2017-05-10 10:02:34 951
原创 多类别分类问题由 confusion matrix 到分类准确率(accuracy)的计算
conf_mat = confusionmat(y_true, y_pred); % 首先根据数据集上的真实 label 值,和训练算法给出的预测 label 值, % 计算 confusion matrixconf_mat = bsxfun(@rdivide, conf_
2017-05-10 09:54:05 7630
matlab字幕拼接用视频截图
2016-01-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人