文本分类学习(一):开篇

今天开始,就要认真开始对待文本分类,在此之前只是稀疏的看过一些博客,了解一下贝叶斯分类。之所以要学习文本分类,是因为我做的毕业设计就是关于文本分类和机器学习的。突然感觉到时间不太够用了,而摆在我面前的实际上是一个很浩大的工程,不得不抓紧时间开始研究。至于为什么毕业设计会选择文本分类算法,因为觉得现...

2018-09-06 14:58:48

阅读数 155

评论数 0

汉字字典树

字典树的概念我就不说了,不过大多题目都是英文的字典树,我就闲的蛋疼去写了中文的字典树,实现起来也挺简单的。#include <iostream> #include <string.h> #include &am...

2018-03-31 17:43:38

阅读数 233

评论数 0

Lucene.net(4.8.0) 学习问题记录五: JIEba分词和Lucene的结合,以及对分词器的思考

前言:目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作,不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ,PanGu分词也是对应Lucene3.6.0版本的。不过好在Lucene.net 已经...

2018-03-28 14:42:35

阅读数 493

评论数 0

Nginx 日志 worker_connections are not enough while connecting to upstream

记一次,排查错误所遇到的问题,和学习到的内容。上周五,刚上线的项目出现了503 ,查看日志发现如下内容:System.Exception: Request api/blogpost/zzkDocs <html>^M <head&am...

2018-03-28 14:40:41

阅读数 2095

评论数 0

Int32 最大的数值是多少???(附十进制十六进制相互转换且包含正负数的java代码)

正数转二进制很简单,转十六进制也很简单。那么负数的情况下呢?在计算机中无法识别你给的符号“+”,"-",计算机只认识0和1 那么在二进制中如何表示负数。 先简单介绍一下负数如何转二进制,八进制,十六进制:比如给的是-4那么先算出+4的二进制表示:1 0 0但是请...

2018-03-28 14:38:58

阅读数 2324

评论数 0

一道网易面试编程题

一条长为n的路,需要用路灯点亮,其中"."表示需要点亮的位置,"X"表示无需点亮的位置,假设灯立在i处,则它可以点亮i-1,i,i+1三个位置,问至少需要多少灯才能点亮整条路。 乍一看,肯定是动态规划:上代码,敲了两个小时的动...

2018-03-28 14:22:41

阅读数 187

评论数 0

温故KMP算法

最近由于某些原因,又回顾了一次KMP算法。上一次回顾KMP算法还是在刷题的时候遇到的:http://blog.csdn.net/dacc123/article/details/50994611在我的记忆力,每次回顾KMP算法都会有新的理解,以为自己理解的很透彻了,等过一段时间再去回顾,又要花一些时...

2018-03-20 10:29:11

阅读数 78

评论数 0

Lucene.net(4.8.0)+PanGu分词器 问题记录一 分词器Analyzer的构造和内部成员ReuseStategy

前言:目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作,不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ,PanGu分词也是对应Lucene3.6.0版本的。不过好在Lucene.net 已经...

2017-12-13 20:38:38

阅读数 496

评论数 0

Git 使用篇二:小组协作开发

上一片搭建了git远程服务器,那么小组成员在使用git开发的时候都有什么要注意的。第一步: 首先每个小组成员,在自己本地建立一个目录,作为工作空间,再去git clone 这个远程仓库: git clone git@xxxxx:/xxx/xxx.git 第二步: 一般的,小组成员需要建立...

2017-09-27 14:06:17

阅读数 752

评论数 0

Git 使用篇二:搭建远程服务器

一般做一个私人的项目,不希望开源的,是不会放在GitHub上的,这个时候我们需要建里一个自己的Git远程服务器,方便小组成员开发。这里以Centos云服务器为例:第一步 如果自己的服务器没有git账号,可以先配置一个git账号(当然不用git账号也可以)$ sudo useradd git $ ...

2017-09-27 13:50:14

阅读数 830

评论数 0

Git 使用篇一:初步使用GitHub,下载安装git,并上传项目

首先在MAC上怎么操作。 在gitHub创立一个账户,在创立一个项目,这就不用我说了对吧。 创建完之后是这样的:   接下来,我们打开https://brew.sh 这是下载homebrew的网站,homebrew 是干嘛的呢,其实就是一个下载工具,我们用这个...

2017-09-27 12:33:41

阅读数 279

评论数 0

Docker 学习应用篇三:使用docker搭建的环境,安装thinksns

Thinksns 是一个开源的社交网站,因为目前的项目需要用到这个,所以就下载一个安装试试看。之前在windows上用了wamp,安装的很顺利。但是项目是要部署到linux上的。于是我便用了Docker 作为Docker的初学者,确实又是一个学习Docker的好机会。安装thinksns,至少...

2017-09-17 15:06:28

阅读数 413

评论数 0

Memcached 简单利用和简单了解(Mac的安装和使用)

Memcached 是一种用于分布式应用的一种缓存机制。应用也比较广泛。这里来学习一下。 首先Memcached 是分布式网站架构都需要用到的缓存机制。缓存就是服务器利用多余的空间上开辟了一个储存空间,在这片储存区域中,我们放入key-value形式的数据。这样的话,前端发来的请求在这片缓存中...

2017-08-29 15:37:03

阅读数 1567

评论数 0

服务器推技术研究Comet

服务器推技术 最近参与的一个关于股票的项目,有这样一个需求。服务器需要主动推送给客户端消息。这和传统的Web模式不同。传统的Web系统,客户端和服务器的交互是这样的: 客户端向服务器发送一个http请求,

2017-08-25 18:40:35

阅读数 213

评论数 0

java后台设计简单的json数据接口,设置可跨域访问,前端ajax获取json数据

在开发的过程中,有时候我们需要设计一个数据接口。有时候呢,数据接口和Web服务器又不在一起,所以就有跨域访问的问题。 第一步:简单的设计一个数据接口。 数据接口,听起来高大上,其实呢就是一个简单的Serlvlet,在有get的请求的时候,返回我们要提供的数据就可以。现在JSON数据...

2017-08-24 10:00:07

阅读数 6604

评论数 0

java 多线程研究:锁的概念

java多线程:锁java的多线程中的锁是干嘛的呢?在网上找了很多博客,大都是很专业的语言,让我一时间摸不着头脑。下面分三个部分来总结多线程中的锁的概念。 一,基础概念:多线程在运行的时候可能会遇到这样的问题,多个线程要用到同一个资源,那么可能会出现错乱,比如线程要改动资源里的数据,那么多个线程同...

2017-08-18 19:22:56

阅读数 2398

评论数 3

PHP 学习笔记之一:thinkPHP的volist标签

Volist标签主要用于在模板中循环输出数据集或者多维数组。属性:name : 必须,输出数据模板变量,后台提供的变量。 id : 必须,是循环变量,可以随便定义,但是不能跟name相同。举个栗子:<volist name="user" id="vo&q...

2017-08-08 10:54:19

阅读数 1613

评论数 1

Flask 学习篇二:学习Flask过程中的记录

Flask学习笔记: GitHub上面的Flask实践项目 https://github.com/SilentCC/FlaskWeb 1.Application and Request Context(上下文) 在Flask 中,一般一个view functio...

2017-07-30 12:55:36

阅读数 419

评论数 0

Docker 学习应用篇之三: Docker的简单实用

安装完Docker之后,我们就可以简单的使用Docker,来体会Docker的用处。

2017-07-30 12:44:05

阅读数 777

评论数 0

CodeForces 832B Petya and Exam

B. Petya and Exam time limit per test 2 seconds memory limit per test 256 megabytes input standard input output standard outp...

2017-07-26 07:34:09

阅读数 515

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭