- 博客(33)
- 资源 (40)
- 问答 (3)
- 收藏
- 关注
原创 Word2Vec Tutorial - The Skip-Gram Model
翻译自:http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/1 模型skip-gram神经网络模型事实上很简单,仅训练一个有一层隐含层的简单网络来完成任务。但我们不使用这个网络,而是要隐含层的权重,这个就是我们要的词向量。可以在自动编码器看到这种做法,在隐含层压缩输入向量,然后在输出层解压缩获得原始向量,训...
2018-02-26 11:06:08 358
原创 7-17 BCD解密(10 分)
7-17 BCD解密(10 分)BCD数是用一个字节来表达两位十进制的数,每四个比特表示一位。所以如果一个BCD数的十六进制是0x12,它表达的就是十进制的12。但是小明没学过BCD,把所有的BCD数都当作二进制数转换成十进制输出了。于是BCD的0x12被输出成了十进制的18了!现在,你的程序要读入这个错误的十进制数,然后输出正确的十进制数。提示:你可以把18转换回0x12,然后再转换回12。输入...
2018-02-25 09:22:30 1613
原创 6-4 查找子串(20 分)
6-4 查找子串(20 分)本题要求实现一个字符串查找的简单函数。函数接口定义:char *search( char *s, char *t );函数search在字符串s中查找子串t,返回子串t在s中的首地址。若未找到,则返回NULL。裁判测试程序样例:#include <stdio.h>#define MAXS 30char *search(char *s, char *t...
2018-02-25 08:57:01 17470 1
原创 6-3 判断回文字符串(20 分)
6-3 判断回文字符串(20 分)本题要求编写函数,判断给定的一串字符是否为“回文”。所谓“回文”是指顺读和倒读都一样的字符串。如“XYZYX”和“xyzzyx”都是回文。函数接口定义:bool palindrome( char *s );函数palindrome判断输入字符串char *s是否为回文。若是则返回true,否则返回false。裁判测试程序样例:#include <stdio...
2018-02-25 08:44:58 11201
原创 6-2 使用函数验证哥德巴赫猜想(20 分)
6-2 使用函数验证哥德巴赫猜想(20 分)本题要求实现一个判断素数的简单函数,并利用该函数验证哥德巴赫猜想:任何一个不小于6的偶数均可表示为两个奇素数之和。素数就是只能被1和自身整除的正整数。注意:1不是素数,2是素数。函数接口定义:int prime( int p );void Goldbach( int n );其中函数prime当用户传入参数p为素数时返回1,否则返回0;函数Goldb...
2018-02-25 08:43:17 8663 3
原创 6-1 使用函数求素数和(20 分)
6-1 使用函数求素数和(20 分)本题要求实现一个判断素数的简单函数、以及利用该函数计算给定区间内素数和的函数。素数就是只能被1和自身整除的正整数。注意:1不是素数,2是素数。函数接口定义:int prime( int p );int PrimeSum( int m, int n );其中函数prime当用户传入参数p为素数时返回1,否则返回0;函数PrimeSum返回区间[m, n]内所有...
2018-02-25 08:41:17 14825
原创 7-16 然后是几点(15 分)
7-16 然后是几点(15 分)有时候人们用四位数字表示一个时间,比如1106表示11点零6分。现在,你的程序要根据起始时间和流逝的时间计算出终止时间。读入两个数字,第一个数字以这样的四位数字表示当前时间,第二个数字表示分钟数,计算当前时间经过那么多分钟后是几点,结果也表示为四位数字。当小时为个位数时,没有前导的零,即5点30分表示为530。注意,第二个数字表示的分钟数可能超过60,也可能是负数。...
2018-02-25 08:37:24 10911 5
转载 机器学习中的算法(2)-支持向量机(SVM)基础
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy 前言: 又有很长的一段时间没有更新博客了,距离上次更新已经有两个月的时间了。其中一个很大的原因是,不知道写什么好-_-,最近一...
2018-02-24 15:24:01 200
转载 Principal component analysis --- PCA的数学原理
转自:http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理...
2018-02-24 15:00:50 201
转载 Singular Value Decomposition
from: http://www.ams.org/publicoutreach/feature-column/fcarc-svdIntroductionThe topic of this article, the singular value decomposition, is one that should be a part of the standard mathematics underg...
2018-02-24 14:41:03 983
转载 潜在语义分析Latent Semantic Analysis (LSA)
转自:http://blog.csdn.net/roger__wong/article/details/41175967在Wiki上看到的LSA的详细介绍,感觉挺好的,遂翻译过来,有翻译不对之处还望指教。原文地址:http://en.wikipedia.org/wiki/Latent_semantic_analysis前言浅层语义分析(LSA)是一种自然语言处理中用到的方法,其通过“矢量语义空间”...
2018-02-24 14:31:04 7361
转载 机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上...
2018-02-24 11:51:32 550 1
转载 word2vec 原理
转自:http://www.cnblogs.com/iloveai/p/word2vec.htmlSVD分解:低维词向量的间接学习既然基于co-occurrence矩阵得到的离散词向量存在着高维和稀疏性的问题,一个自然而然的解决思路是对原始词向量进行降维,从而得到一个稠密的连续词向量。第一个出场的对原始矩阵进行降维的方法是奇异值分解(SVD)。SVD的基本思想是,通过将原co-occurrence...
2018-02-24 11:36:24 3467
转载 隐马尔可夫模型(HMM)攻略
转自:http://blog.csdn.net/likelet/article/details/7056068隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想...
2018-02-22 19:32:29 221
转载 隐马尔可夫模型(HMM)实现分词
转自:http://blog.csdn.net/zkl33a/article/details/68927132隐马尔可夫模型(HMM)实现分词最近在调研分词的一些工作,又重新看了一遍HMM,发现原来之前看过的,竟然给忘的干干净净!之前看的,真是喂了狗了,于是决定把这次的理解记录下来,俗话说,好记性不如赖笔头嘛。第一次写博客,以下纯属个人理解,如果有误,请指正~模型的定义HMM(Hidden Mar...
2018-02-22 18:06:30 1703
转载 UFLDL 教程学习笔记
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起,在新浪微博上召集志愿者对该教程进行翻译,并于 4 月 8 日全部完成,非常感谢所有参与者...
2018-02-22 16:52:07 404
原创 python2.7+pyqt4安装
python2.7+pyqt4安装http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyqt4下载对应的whl,我为:PyQt4-4.11.4-cp27-cp27m-win32.whlpip install PyQt4-4.11.4-cp27-cp27m-win32.whl安装成功
2018-02-22 16:51:39 22546 1
转载 Python2.7+PyQt5的安装
当前Deadline7版本使用的是Python2.7+Qt5作为框架,来进行的开发,为了与之配合,做定制项目开发的时候,也需要同样的版本搭配。为此在网上搜索了一下,看到PyQt的官网,PyQt5只有针对Python3的安装包而没有针对Python2.7的,似乎只有下载自行编译一途。但是自己在Windows上编译Pyqt5,在尝试之后终于放弃,依赖多多,错误多多。最后经过网友提醒,可以使用pip来安...
2018-02-22 16:50:44 15026 4
原创 eclipse快捷键
1. 注释一行(//)ctrl+shift+C、Ctrl+/2. 把选中的多行注释(/* */)ctrl+shift+/3. 注释多行、解除注释ctrl+shift+c按一次注释、第二次解除注释4. 选中一行或几行的文字的一段ctrl+shift...
2018-02-22 16:50:25 120
转载 隐形马尔可夫模型 Hidden Markov Model
作者:Yang Eninala链接:https://www.zhihu.com/question/20962240/answer/33438846来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。隐马尔可夫(HMM)好讲,简单易懂不好讲。我认为 @者也的回答没什么错误,不过我想说个更通俗易懂的例子。我希望我的读者不是专家,而是对这个问题感兴趣的入门者,所以我会多阐述数学...
2018-02-22 15:22:52 2144
转载 MOOC|Coursera课程批量下载(保持资源原目录结构)
转自:https://mooc.guokr.com/post/560/一、安装python环境1、下载python(64位或32位,例如Windows X86-64 MSI Installer),双击安装:http://www.python.org/getit/releases/2.7.6/2、添加python安装路径(找到python.exe),我的电脑->属性->高级系统配置-&g...
2018-02-21 09:45:06 14917 4
原创 我理解的信息论——自信息、熵、互信息
转自:http://blog.csdn.net/qtlyx/article/details/50819094信息论 信息是关于事物的运动状态和规律的认识,它可以脱离具体的事物而被摄取、传输、存贮、处理和变换。 信息论,就是用数理统计方法研究信息的基本性质以及度量方法,研究最佳解决信息的摄取、传输、存贮、处理和变换的一般规律的科学。它的成果将为人们广泛而有效地利用信息提供基本的技术方法和必要的...
2018-02-19 21:21:44 9393 1
转载 使用sklearn进行集成学习——实践
转自:http://www.cnblogs.com/jasonfreak/p/5720137.html系列《使用sklearn进行集成学习——理论》《使用sklearn进行集成学习——实践》目录1 Random Forest和Gradient Tree Boosting参数详解2 如何调参? 2.1 调参的目标:偏差和方差的协调 2.2 参数对整体模型性能的影响 2.3 一个朴实的方案:贪心...
2018-02-19 20:33:28 256
转载 使用sklearn进行集成学习——理论
转自:http://www.bubuko.com/infodetail-2071336.html系列《使用sklearn进行集成学习——理论》《使用sklearn进行集成学习——实践》目录1 前言2 集成学习是什么?3 偏差和方差 3.1 模型的偏差和方差是什么? 3.2 bagging的偏差和方差 3.3 boosting的偏差和方差 3.4 模型的独立性 3.5 小结4 Gradie...
2018-02-19 20:31:13 316
转载 使用sklearn优雅地进行数据挖掘
转自:http://www.cnblogs.com/jasonfreak/p/5448462.html目录1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术2 并行处理 2.1 整体并行处理 2.2 部分并行处理3 流水线处理4 自动化调参5 持久化6 回顾7 总结8 参考资料1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤 数据挖掘...
2018-02-19 20:19:52 198
原创 使用sklearn做单机特征工程
转自:https://www.jianshu.com/p/114385e5a757目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1...
2018-02-19 20:15:08 126
转载 结合Scikit-learn介绍几种常用的特征选择方法
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种自己最熟悉或者最方便的特征...
2018-02-19 16:08:37 306
转载 python + sklearn ︱分类效果评估——acc、recall、F1、ROC、回归、距离
转自:http://blog.csdn.net/sinat_26917383/article/details/75199996?locationNum=3&fps=1http://www.cnblogs.com/robert-dlut/p/5276927.htmlhttp://d0evi1.com/sklearn/model_evaluation/谈谈评价指标中的宏平均和微平均谈谈评价指标...
2018-02-17 15:30:06 9639
转载 UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 11126: illegal multibyte sequence
转自:http://blog.csdn.net/shijing_0214/article/details/51971734使用python的时候经常会遇到文本的编码与解码问题,其中很常见的一种解码错误如题目所示,下面介绍该错误的解决方法,将‘gbk’换成‘utf-8’也适用。 (1)、首先在打开文本的时候,设置其编码格式,如:open(‘1.txt’,encoding=’gbk’); (2)、若(...
2018-02-15 18:09:05 1368
转载 文本分类实战--从TFIDF到深度学习(附代码)
转自:http://blog.csdn.net/liuchonge/article/details/72614524这几周因为在做竞赛所以没怎么看论文刷题写博客,今天抽时间把竞赛用到的东西总结一下。先试水了一个很小众的比赛–文因互联,由AI100举办,参赛队不足20个,赛题类型是文本分类。选择参赛的主要原因是其不像阿里们举办的竞赛那样,分分钟就干一件事就是特征工程和调参,然后数据又多又乱,不适合入...
2018-02-09 16:28:29 3177 1
转载 解决问TensorFlow和Coursera的问题
访问TensorFlow1、更改Hosts 在Windows的host文件(位置在C:\Windows\System32\drivers\etc\hosts)末尾添加如下内容:#TensorFlow start 64.233.188.121 www.tensorflow.org #TensorFlow end1232、刷新DNS缓存 打
2018-02-02 11:35:13 543
转载 http://blog.csdn.net/u013055678/article/details/59107932
anaconda官网下载安装:https://www.continuum.io/downloads/anaconda用法:查看已经安装的包:pip list 或者 conda list安装和更新:pip install requestspip install requests --upgrade或者cond
2018-02-01 20:47:23 173
oracle 中文版和习题
2017-09-03
Data Mining - Concepts and Techniques (3rd Ed).pdf )
2016-09-26
关于文本检测的论文,概述
2020-05-11
Scene text detection and recognition_ recent advances and future trends.pdf
2020-05-11
Scene text detection and recognition with advances in deep learning.pdf
2020-05-11
A comparative anal.pdf
2019-08-14
A Survey on Transfer Learnin Sinno Jialin Pan and Qiang Yang pdf
2018-12-12
window.location.reload()的执行过程
2021-05-26
freemarker 写的 一个表格,表格增加数据后,只需要更新这个表格
2021-05-12
xrdp:window7连接Ubuntu16出现错误
2019-01-10
TA创建的收藏夹 TA关注的收藏夹
TA关注的人