自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 通俗、有逻辑的写一篇说下Xgboost的原理,供讨论参考

原文:https://blog.csdn.net/github_38414650/article/details/76061893     

2018-11-05 13:46:10 666 1

原创 运用python将json文件保存成csv文件

工具:  spyder ,codecs  ,pandas# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""#-*-coding:utf-8-*-import jsonimport codecsimport pandas as pddef trans(path):    jso...

2018-10-30 18:23:01 2067

原创 NLP 分词相关知识

1.2 中文分词方法介绍 现有的分词方法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。 1.2.1 基于字符串匹配的分词方法 基于字符串匹配的分词方法又称机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。 按照扫描方向的不同,字符串匹配分词...

2018-09-25 17:09:47 360

原创 运用java 调用tensorflow中的inception v3模型

首先使用maven添加依赖项:<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaL...

2018-09-25 16:49:11 896 4

原创 利用java编写thrift来对inception模型进行访问与部署

thrift就是一个跨语言调用的软件框架。首先运用thrift生成一个客户端与服务端文件, 客户端:就是设置ip地址等信息,并调用服务端信息。import cn.thrift.Tensorflow_Service;import org.apache.thrift.TException;import org.apache.thrift.protocol.TBinaryProtoco...

2018-09-25 16:42:13 298

原创 K-nn与K-means的区别

2018-09-25 10:22:20 1213

原创 利用sklearn 朴素贝叶斯进行评论短语的分类

功能:对评论短语,比如一个文章下的评论短语进行分类通过或者删除,也就是是垃圾 、不是垃圾。工具:Spyder,jieba分词,numpy,joblib,sklearn程序:# -*- coding: utf-8 -*-"""Created on Mon May 14 10:12:38 2018@author: Administrator"""import codecsimport jiebafro...

2018-05-14 17:55:44 762

原创 利用java实现对文本的去除停用词以及分词处理

功能:对txt文档进行分词处理,并去除停用词。工具:IDEA,java,hankcs.hanlp.seg.common.Term等库。程序:import java.util.*;import java.io.*;import java.lang.String;import java.lang.StringBuilder;import com.hankcs.hanlp.seg.commo...

2018-04-12 18:07:32 8380 6

原创 利用python及jieba分词和gensim模块计算文本相似度

由于工作需要,接触自然语言处理,写一些笔记,请大家指教。功能:实现把文本库中和输入文本相似的文本输出。工具:Spyder,python3.6,codecs,jieba,gensim等模块。(需要自己安装相关模块,我使用的是pip安装)程序:# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import...

2018-04-12 17:41:21 7177 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除