python爬虫采集网络信息

from bs4 import BeautifulSoup import re import urllib.parse import urllib.request import os import datetime import json # params CategoryId=808 Cat...

2018-07-27 11:11:20

阅读数 150

评论数 2

小白第一次在阿里云服务器上部署web项目

做web项目开发的时候,以前都是大牛把框架搭建好,自己往里面写代码。久而久之,小白也想自己搭框架,自己在服务器上部署。所以在本地搭建了一个基于NetBeans+spring+Mybatis+MVC 的web项目框架,搭建过程可参考之前的博客。 传送门【web项目搭建】 项目搭建好了,就想在服务...

2018-07-25 16:38:07

阅读数 16744

评论数 12

MySql使用笔记

1、replace函数 去除company_name这一列中包含‘/’这一字符 update stang_bid_envelope set company_name=REPLACE(company_name,’/’,”) WHERE company_name LIKE ‘%/’ 2、SU...

2018-07-23 10:37:44

阅读数 54

评论数 0

python+nltk安装+jieba分词安装

jieba(结巴)是一个强大的分词库,完美支持中文分词,且适用于python语言,本文对其安装做了简单的笔记。

2018-07-20 11:29:33

阅读数 225

评论数 0

Maven本地加入第三方依赖包

Netbeans构建时有些第三方依赖包无法构建成功,就需要手动加入依赖包,方法如下:

2018-07-20 11:21:27

阅读数 128

评论数 0

NetBeans+spring+Mybatis+MVC web项目框架搭建

以前笔记喜欢记在本子上,可是本子过段时间可能就搞丢了(o(╯□╰)o),然后又不像写博客,所以就只能拍照上传,方便查阅。

2018-07-20 11:08:28

阅读数 1289

评论数 1

使用Eclipse搭建Hadoop编程环境

懒得写博客,直接上图,方便以后查看。

2018-07-20 10:57:44

阅读数 46

评论数 0

Java实现给定字符串或者链表的排列组合

需求介绍: 1、已知字符串chs = {‘a’, ‘b’, ‘c’},实现a,b,c的所有排列组合(可重复排列) 思路: abc三个字符组成的所有长度为3的字符串,aaa,aab,aac……ccc 一共27种 利用递归的思想,第一个字符可以从abc中选择一个,三种选择,之后问题转化为abc...

2018-06-29 17:46:10

阅读数 168

评论数 0

虚拟机上搭建storm集群详细教程

vmware+ubuntu+storm集群搭建 前言 Storm是一个分布式的、高容错的实时计算系统。 Storm对于实时计算的的意义相当于Hadoop对于批处理的意义。Hadoop为我们提供了Map和Reduce原理,使我们对数据进行批处理变的非常的简单和优美。同样,Storm也对数据...

2018-05-04 15:13:58

阅读数 271

评论数 0

Ubuntu17.04配置SSH服务

ssh是一种安全协议,主要用于给远程登录会话数据进行加密,保证数据传输的安全,现在介绍一下如何在Ubuntu 17.04上安装和配置ssh. 方法和步骤 一、配置ssh服务 1、更新源列表 打开”终端窗口”terminal,输入”sudo apt-get update”–&am...

2018-03-20 11:49:43

阅读数 840

评论数 1

方差、标准差、均方差、均方误差区别总结

一、百度百科上方差是这样定义的: 方差(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程度有着...

2018-03-09 11:33:55

阅读数 436

评论数 0

机器学习算法——PCA算法介绍以及Java实现

PCA算法 一、算法概述 主成分分析(PCA)是多元统计分析中用来分析数据的一种方法,PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。 PCA方法最著名的应用应该是在人脸识别中特征提取及数据维,我们知道输入200*200大小的人...

2018-02-07 11:45:38

阅读数 2302

评论数 8

Java调用jama实现矩阵运算

一、jama简介 Jama是一个基本的线性代数java包。包括一个基本的Matrix类和5个矩阵分解类。 Matrix类提供了基本的线性代数数值运算的功能,不同的构造函数可以构造双精度和浮点精度的二维数组,而不同的gets和sets方法可以返回子矩阵和矩阵元素。 二、矩阵操作 2....

2018-02-07 10:28:19

阅读数 238

评论数 0

机器学习算法——决策树ID3算法介绍以及Java实现

一、 决策树算法 决策树:是一种用于对实例进行分类的树形结构,可以是二叉树或非二叉树,由节点(node)和有向边(directed edge)组成。其中每个非叶子节点表示一个特征属性,叶子节点代表类别属性,它的值由根节点到叶子节点这一分支的属性值确定。使用决策树进行分类的过程,就是从根节点出发,...

2018-02-05 17:50:57

阅读数 428

评论数 0

java 中List排序函数Collections.sort的用法详解

List排序函数Collections.sort 1.Java提供的默认排序算法 List list = new ArrayList(); list.add(53.6); list.add(45.9); list.add(75.1); list.add(89.3); list.add(...

2018-01-11 16:14:46

阅读数 687

评论数 0

TF-IDF算法讲解和Java实现

一、 TF-IDF算法原理TF-IDF是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。TF-IDF是一种统计方法,用以评估某个字词对于一个语料库中的其中一份文本的重要程度。字词的重要性随着它在文本中出现的次数成正比增加,但同时会随...

2017-12-27 10:42:32

阅读数 990

评论数 2

Java 时间、时间戳相互转化

Java 时间、时间戳相互转化 /** * Data型时间戳转换成String时间 * @return String时间 */ public static String dataToString(){ SimpleDateFormat simpleDate...

2017-11-28 17:37:35

阅读数 203

评论数 0

基于HanLP分词的命名实体提取

文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。对于文本来说,由于语言组织形式各异,表达方式多样,文本里面提到的很多要素,如人名、手机号、组织名、地名等都称之为实体。在工程领域,招投标文件里的这些实体信息至关重要。利用自然语言处理技术从...

2017-11-03 17:43:57

阅读数 5175

评论数 11

使用git上传项目到Github之新手教程

gitHub是一个面向开源及私有软件项目的托管平台。作为一名码农,我们经常需要把本地项目上传到github平台上,方便团队开发与管理。所以总结了第一次使用github的新手教程。目录 注册账户以及创建仓库 安装git客户端 配置git 上传本地项目注册账户以及创建仓库第一步,当然是登录github...

2017-10-13 18:03:27

阅读数 181

评论数 0

Java实现验证码的生成

今天按组长要求,实现了前端登录界面验证码生成及识别功能,确保网站的安全性,无聊之余,总结今天的工作内容。下面是部分代码的讲解。上图为前端代码,img标签里加入src的链接,CheckCodeAction.java为后台验证码的生成和验证。changImg()鼠标点击事件为调用后台CheckCode...

2017-10-13 16:07:31

阅读数 170

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭