自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 基于内容的推荐算法之关键词提取

基于内容的推荐算法是比较早期的易理解的推荐算法,其主要思想就是:我们首先给根据信息的特征给信息一些属性(可以称之为“标签”)。对于一篇文章,或者一段话它的属性就可以理解成它的关键词,这篇文章的主讲内容就是文章的关键词提取。一、TF-IDF方法TF(Term Frequency)词频,直观上指的是某个词在文章中的出现次数,为了避免文章长短带来的影响,对于不同的文章,词频的计算应该归一化。文章的标签应...

2018-06-13 20:01:20 5466 1

原创 网站建设与深度学习(PHP调用Python程序)

一、深度学习应用我采用的时Google开发的Tensorflow深度学习框架,基于Python编写的图片语义描述深度学习应用。二、PHP调用php中无法带哦用python程序中的方法,但是可以执行python程序,但是不知道什么原因,php中无法执行引入了TensorFlow包的python程序,因此只有将python程序封装为可执行文件,windows下为exe,这时便可用执行exe的方式在ph...

2018-05-21 15:34:24 3508 1

原创 简单网页前端设计(图片搜索引擎)

在wampserver运行的php脚本更改的别人的模板index.php<!DOCTYPE html><html lang="en"><head>    <meta charset="utf-8">    <meta http-equiv="X-UA-Compatible" content="IE=edge

2018-05-20 20:41:35 1852

原创 Windows平台下利用WampServer搭建服务器

一、各种环境win10系统,WampServer3二、具体步骤首先到官网上下载WampServer并按照步骤安装,运行。启动所有服务,更改相应配置:首先右键任务栏中WampServer图标,在Setting中选择Meun item :Online/Offline,然后再左键WampServer图标切换到在线状态。更改配置文件:要更改的是Apache服务下的配置文件httpd.conf和httpd....

2018-05-20 20:34:06 574

原创 Lucene实现中文分词

在之前的文章中已经介绍过Lucene了,这里就不多做介绍。一、中文分词的原理中文分词是将一个汉字序列切分为一个一个单独的词。分词就是讲连续的字序列安装一定的规范重新组合成词序列的过程。随着机器学习的发展,很多分词的方法都已经被科研人员实现,也越来越精确。分词的精确性一定程度上影响了搜索引擎的查全率与查准率,当然这是在你的中文分词运用在搜索引擎的前提之下。分词的算法可以分为:基于字符串匹配的分词方法...

2018-05-20 20:23:57 1152

原创 基于极值区域与连通区域的图片中文本区域定位

一、极值区域极值区域(Extremal Region)是指图片中一片相似区域的集合,此集合内所有的像素值都与外界的像素值存在着较大的差距。可以理解为区域外边界的像素值严格大于区域内像素值的区域。极值区域在数学上的定义,首先将图像I视为一种映射:图像I的的一个通道C的映射就可以理解为:  A表示一种邻接关系,长为D,宽为D区域内的像素是邻接的,这样就可以把图像I或者通道C中的区域R,理解为一个D的连...

2018-05-19 16:05:56 1944 1

原创 简单垂直搜索引擎入门(java+Lucene)

一、垂直搜索引擎介绍垂直搜索引擎是搜索引擎的一种,是搜索引擎的细分和延伸,可以简单地理解为在某个领域的搜索引擎,例如在你的所有文档中搜索相关内容,在你的项目文件中搜索带有“test”字眼的文档。二、Lucene介绍...

2018-05-18 22:36:26 4059

原创 信息检索中的特征空间变化

一、背景及概述    对于一篇文章或者是一段文字信息,我们想要获取其中的关键信息,如果是中文,我们首先要对其进行分词的预处理,中文分词有很多开源的技术,如python就有结巴模块用来做中文分词,网上有很多博客详细讲解,这边不是我们这部分工作的重点内容,在这里就不详细讲解了。(关于python中结巴分词)通过对连续的语义的分词我们会得到由多个独立词语构成的信息,这里就需要合适的信息检索模型,来判断两...

2018-05-05 01:00:48 648

原创 Tensorflow模型数据的存储与读取

Tensorflow是谷歌开发的深度学习框架,目前运用已经被广泛应用各种项目,关于Tensorflow框架的介绍这里就不详细阐述了,本文针对那些对Tensorflow有所了解,可以根据教程编写训练和测试Minist数据集的同志们。运行环境:win10下利用Anaconda配置的Tensorflow,IDE使用Spyde(因为对Spyde的不了解,在使用过程中确实出现了一些问题,本文后面会具体阐述)...

2018-04-08 15:02:29 1012

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除