自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

懒骨头707

记录自己的学习过程

  • 博客(6)
  • 资源 (12)
  • 收藏
  • 关注

原创 用Python实现ElasticSearch的智能搜索

一、ElasticSearch的安装         针对安装ElasticSearch以及专门处理中文的IK分词,网上一搜一大把,这里就不说明了。二、文本预处理         本次的文本是word文档,所以我么先进行TXT转换。转换代码如下:         '''将docx转化为txt'''def docx_to_text(): wordapp = win32...

2018-08-28 17:56:35 4968

原创 Python:用机器学习方法实现搜索引擎或者智能匹配系统

1.准备工作      在本文开始之前,我们首先是对原始的CSV表格的数据读取,然后分词,之后才开始进行智能匹配。csv的读取和分词都在之前的博客,所有的代码都是一个工程的。但是由于训练集是公司的数据,所以不方便放出,请谅解。但是对于训练集数据的描述CSV读取的博客中有提到。     csv的读取:https://blog.csdn.net/qq_28626909/article/deta...

2018-08-14 21:59:50 9015 10

原创 python下使用jieba分词

        在本博客之前,我们先采用python处理过之前的csv数据。我们本次是用python对之前的数据进行分词处理。上一个博客链接:https://blog.csdn.net/qq_28626909/article/details/81674612#!D:/workplace/python# -*- coding: utf-8 -*-# @File : fenci.py...

2018-08-14 21:17:38 1307

原创 用Python处理CSV格式的文件

如题,我直接上代码。#!D:/workplace/python# -*- coding: utf-8 -*-# @File : CSV_Cleaning.py# @Author: WangYe# @Date : 2018/7/20# @Software: PyCharmimport csvimport numpy as np# import syspath = 'C:/...

2018-08-14 21:10:01 1137

原创 windows+linux下安装spark

1.准备工作:     linux:spark2.2.1+scala2.11.12+java1.8+python3.6       windows:spark2.2.1+scala2.12.4+java1.8+python3.6     由于这些版本都是对应的,python,jdk,scala这三个都要安装,一个都不能少,所以我们需要配套安装。anaconda和jdk很好下载,...

2018-08-13 21:19:42 9437 11

原创 Spark下:Java gateway process exited before sending the driver its port number等问题

如题,贴出问题:     raise Exception("Java gateway process exited before sending the driver its port number")Exception: Java gateway process exited before sending the driver its port number那么大家各种搜索,但是问题不...

2018-08-13 21:19:31 28209 4

基于机器学习的文本分类.pptx

这是一个关于机器学习文本分类的PPT,针对这个PPT,有一个我的博客是我这个PPT中代码的实现,博客链接:https://blog.csdn.net/qq_28626909/article/details/80382029

2019-06-20

互联网金融管理.rar

这里面是互联网金融的论文,里面大约有30篇论文,均是已经整理好的论文

2019-06-17

santander-customer-satisfaction.zip(银行客户满意度分类,二分类问题)

本数据集是一个桑坦的银行的一个数据集,里面是分析客户流失的一个csv文件,这是一个非常好的机器学习数据集

2019-06-05

12类文本以及同义词库.rar

中文文本分类的语料库,一共12类,全是txt文本,有电子游戏,科学,农业,社会,生活,娱乐,艺术等等等,还提供同义词词库

2019-05-31

DeepLab_v3.rar

本代码是deeplabv3的一个复现,进入代码后数据集可以直接输入 python download.py 下载数据集,下载之后可以输入 python train.py即可运行,输入python test_demo.py可以先测试一下,均可直接运行

2019-05-29

人脸识别数据集.docx

在word文档中有数据集迅雷下载链接,readme里有数据集的详细介绍,是做图像的一个非常好的数据集

2019-05-29

LSTM相关论文(中文加英文)

这是我自己学习时候整理的论文,可以下载以及看看LSTM的相关论文

2019-05-06

分布式深度学习论文(tensorflow的并行计算)

大量我自己学习的时候下载以及老师给的分布式深度学习的论文,可以学习使用

2019-05-06

步进电机基础概念(步进电机工作原理)

步进电机是将电脉冲信号转变为角位移或线位移的开环控制元件。在非超载的情况下,电机的转速、停止的位置只取决于脉冲信号的频率和脉冲数,而不受负载变化的影响,即给电机加一个脉冲信号,电机则转过一个步距角

2018-08-09

遗传算法综述(本文主要回顾了遗传算法的起源和发展历程, 并对遗传算法的基本原理及特点作了简要阐述。)

遗传算法来源于进化论和群体遗传学, 是计算智能的重要组成部分, 正受到众多学科的高度重视。 本文主要回顾了遗传算法的起源和发展历程, 并对遗传算法的基本原理及特点作了简要阐述。

2018-08-09

监督学习训练集+测试集+停用词

监督学习的训练集+测试集+停用词。可以直接下载。数据集中有四个分类,每个1000+个。停用词是哈工大停用词。

2018-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除