自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (20)
  • 问答 (1)
  • 收藏
  • 关注

原创 python下Kafka 教程系列(二)安装与基本操作

kafkakafka简介(摘自百度百科) 简介: afka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方...

2018-05-31 19:10:40 7187 3

原创 redis基本操作命令整理ING

服务器相关命令 命令 介绍 select database 选择数据库(Redis 数据库编号从 0~15) quit 退出 echo msg 打印msg dbsize 返回当前数据库中 key 的数目` info 获取服务器的信息和统计 flushdb 删除当前选择数据库中的所有 key flush...

2018-05-31 14:34:31 722

原创 Redis之MISCONF Redis is configured to save RDB snapshots错误

操作redis过程中并没有修改什么配置,出现如下错误, Redis之MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk. Commands that may modify the data set are disabled. Please check Red...

2018-05-30 23:01:32 2095

原创 日常电脑操作小技能篇(生活无处不精彩)

温馨提示,如果你有更好的方法欢迎留言分享大文件预览1.当我们处理大数据过程中,数据量特别的大,比如有如下文件达到800M, 使用记事本或者是Notepad均打不开。 那么我们又要查看数据,又不想写程序查看,可以在cmd中执行如下type C:\Users\lenovo\Desktop\NewShortestPathCountrywideComplete.txt操作流...

2018-05-29 10:17:48 1511

原创 深度学习入门(一),从Keras开始

深度学习:Keras入门(一)之基础篇安装keras1.关于Keras2.Keras的模块结构3.使用Keras搭建一个神经网络4.基本概念5.第一个示例安装keras安装环境:Anaconda(python3.6) 首先安装:tensorflow.(通过navigator,可参见直通车) 检验:import tensorflow as t...

2018-05-22 11:18:06 5529 1

原创 python之协程的那些事

python如何设置多进程(直通车)协程基本概念协程,又称微线程,纤程。英文名Coroutine。协程是一种用户态的轻量级线程。协程原理协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次...

2018-05-21 10:58:28 1020

原创 程序员进阶之路之面试题与笔试题集锦(三)线上编程题

来源:网易1.奇数偶数问题小易准备去魔法王国采购魔法神器,购买魔法神器需要使用魔法币,但是小易现在一枚魔法币都没有,但是小易有两台魔法机器可以通过投入x(x可以为0)个魔法币产生更多的魔法币。 魔法机器1:如果投入x个魔法币,魔法机器会将其变为2x+1个魔法币 魔法机器2:如果投入x个魔法币,魔法机器会将其变为2x+2个魔法币 小易采购魔法神器总共需要n个魔法币,所以小易只能通过...

2018-05-16 16:33:43 1451

原创 windows下Bitnami Redmine的安装

项目管理工具是团队开发过程中必不可少的工具,比较流行的包括JIRA、trac、redmine、xplanner等。redmine系统以其轻量、易上手等特点吸引了越来越多人的注意,作为其特色的甘特图,也为其赢得了更多的称赞和口碑。 公司要进行敏捷开发管理,最后选择Redmine作为管理工具。 redmine是一个支持中文的开源项目管理系统,基于Ruby on Rails,支持功能灵活而丰富:多项目...

2018-05-12 13:58:49 4755

原创 从零到一spark进阶之路(二)

从零到一spark进阶之路(二) 关于从零到一spark进阶之路(一)请点击直通车

2018-05-11 17:55:36 981

原创 从零到一spark进阶之路(一)

从零到一spark进阶之路(一)1.RDDRDD是spark特有的数据模型,谈到RDD就会提到什么弹性分布式数据集,什么有向无环图,本文暂时不去展开这些高深概念。(0)随便找个点理解以下最重要的记住,RRD是不可变的,也就是说,已有的RDD不能被修改或者更新,但可以从已有的RDD转化成一个新的RDD.上面的特性解读: RDD可以cache到内存中,每次对RDD数据集的操作...

2018-05-11 17:54:11 1609

原创 python下的pyspark报错集锦

1.WARN Utils: Service ‘SparkUI’ could not bind on port 4040. Attempting port 4041.出现这种错误是是在spark启动从节点时出现的。 解决的方法是,在spark-env.sh中加入一条 SPARK_LOCAL_IP=127.0.0.1 然后就完美解决报错了! D:\spark\spark-2.2.0-bin...

2018-05-11 17:10:05 4338

原创 程序员进阶之路之面试题与笔试题集锦(二)

程序员进阶之路之面试题与笔试题集锦(二) 其一参考: 程序员进阶之路之面试题与笔试题集锦(一)

2018-05-11 14:07:15 716

原创 程序员进阶之路之面试题与笔试题集锦(一)

一、数据结构-算法的时间复杂度和空间复杂度在编程题之前,首先我们先来聊聊时间复杂度:算法复杂度分为时间复杂度和空间复杂度。其作用: 时间复杂度是指执行算法所需要的计算工作量;而空间复杂度是指执行这个算法所需要的内存空间。(算法的复杂性体现在运行该算法时的计算机所需资源的多少上,计算机资源最重要的是时间和空间(即寄存器)资源,因此复杂度分为时间和空间复杂度)。 简单理解: (1)时间复杂...

2018-05-11 13:03:33 2969

原创 GBDT分解形式理解,整理中2018-5-10

GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于搜索排序的机器学习模型而引起大家关注。GBDT主...

2018-05-10 13:10:13 573

原创 python数据预处理之将类别数据转换为数值的方法

在进行python数据分析的时候,首先要进行数据预处理。有时候不得不处理一些非数值类别的数据,嗯, 今天要说的就是面对这些数据该如何处理。目前了解到的大概有三种方法:1,通过LabelEncoder来进行快速的转换;2,通过mapping方式,将类别映射为数值。不过这种方法适用范围有限;3,通过get_dummies方法来转换。import pandas as pdf...

2018-05-08 12:16:36 15741

原创 随机森林(Random Forest)  参数解读

基本原理随机森林(Random Forest)基本原理参考:https://blog.csdn.net/hhtnan/article/details/54580994#A. max_features:随机森林允许单个决策树使用特征的最大数量。 Python为最大特征数提供了多个可选项。 下面是其中的几个:Auto/None :简单地选取所有特征,每颗树都可以利用他们。这种情...

2018-05-08 11:33:57 11738 1

Scalable Modified Kneser-Ney Language Model Estimation语言模型PPT

统计语言模型工具有比较多的选择,目前使用比较好的有srilm及kenlm,其中kenlm比srilm晚出来,训练速度也更快,而且支持单机大数据的训练。现在介绍一下kenlm的使用方法。

2018-11-19

基于深度学习的中文机构名识别研究-一种汉字级别的循环神经网络方法

命名主体识别【目的】中文机构名结构复杂、罕见词多, 识别难度大, 对其进行正确识别对于信息抽取、信息检索、知 识挖掘和机构科研评价等情报学中的后续任务意义重大。【方法】基于深度学习的循环神经网络(Recurrent Neural Network, RNN)方法, 面向中文汉字和词的特点, 重新定义了机构名标注的输入和输出, 提出汉字级别的循环网 络标注模型。【结果】以词级别的循环神经网络方法为基准, 本文提出的字级别模型在中文机构名识别的准确率、 召回率和F 值均有明显提高, 其中F 值提高了1.54%。在包含罕见词时提高更为明显, F 值提高了11.05%。【局 限】在解码时直接使用了贪心策略, 易于陷入局部最优, 如果使用条件随机场算法进行建模可能获取全局最优结 果。【结论】本文方法构架简单, 能利用到汉字级别的特征来进行建模, 比只使用词特征取得了更好的结果。

2018-10-19

mabaXterm ssh linux连接工具,一个非常好用的工具

一款豪华、全功能的终端软件MobaXterm。它不仅可以像PuTTY一样通过SSH连接Raspberry Pi等开源硬件,并且还能: 直接的便携版 内建多标签和多终端分屏 内建SFTP文件传输 内建X server,可远程运行X窗口程序 直接支持VNC/RDP/Xdmcp等远程桌面 默认的UTF-8编码 更加友好的串口连接设置 操作更明确,更少的“神秘技巧”

2018-08-03

基于矩阵分解的个性化推荐系统——论文

基于矩阵分解的个性化推荐系统——论文,比较不错的论文

2018-05-15

数学建模模板(建模论文竞赛标准版)

数学建模模板(建模论文竞赛标准版),1. 应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法应用意识:要解决实际问题,结 果、论符合;模型方法果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。 果要易于理解,便实际应用;站在者的立场上想问题处。  2. 数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象数学建模:用方法解决问题, 要有型;的抽象方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。 方法有普适性、科学,不局限于本具体问题的解决。  3. 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 创新意识:建模有特点,更加合理、科学效符实际;普遍 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。 应用意义;不单纯为创新而。

2018-01-13

写好数学建模竞赛答卷注意事项(参赛宝典)

写好数学建模竞赛答卷注意事项(参赛宝典)

2018-01-13

go1.9rc2.windows-amd64.msi,文件为2017年最新GO

官方提供的最新Go语言安装包, 2017年go1.9rc2.windows-amd64.msi

2017-11-17

window_mongodb执行过程个人笔记——不建议下载.txt

window_mongodb执行过程个人笔记——不建议下载.txt Mongodb,分布式文档存储数据库,由C++语言编写,旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个高性能,开源,无模式的文档型数据库,是当前NoSql数据库中比较热门的一种。它在许多场景下可用于替代传统的关系型数据库或键/值存储方式。Mongo使用C++开发。

2017-10-17

pagerank算法英文文档

PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由[1] 根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。Google的创始人拉里·佩奇和谢尔盖·布林于1998年在斯坦福大学发明了这项技术。 PageRank通过网络浩瀚的超链接关系来确定一个页面的等级。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源(甚至来源的来源,即链接到A页面的页面)和投票目标的等级来决定新的等级。简单的说,一个高等级的页面可以使其他低等级页面的等级提升。

2017-09-20

基于最小领域知识的主题建模 :Topic Modeling with Minimal Domain Knowledge

基于最小领域知识的主题建模 ,一种基于融合知识的主题模型的微博话题发现方法,涉及自然语言处理领域 传统的主题挖掘技术基于概率统计的混合模型,对文本信息进行建模,使得模型能够自动挖掘出文本中潜在的语义信息,使用户能够快速的了解文本中所涉及的内容。通过主题模型,不仅能够获得文本集合中主要涉及的信息,而且能够获得每篇文档中的内容信息。常见的主题模型有概率潜在语义分析(ProbabilisticLatentSemanticAnalysis,PLSA)模型[1]和潜在狄利克雷分配(LatentDirichletAllocation,LDA)模型[2]。但该类技术仅考虑文本集合中的文本信息,其他有用的信息,如文本的类别信息等,无法被利用起来。

2017-09-19

TextRank算法的参考资料论文

 TextRank 算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的 PageRank算法, 通过把文本分割成若干组成单元(单词、句子)并建立图模型, 利用投票机制对文本中的重要成分进行排序, 仅利用单篇文档本身的信息即可实现关键词提取、文摘。和 LDA、HMM 等模型不同, TextRank不需要事先对多篇文档进行学习训练, 因其简洁有效而得到广泛应用。

2017-09-19

高德地图API POI分类编码表

高德地图 API POI 分类编码表,地理编码/逆地理编码 API 是通过 HTTP/HTTPS 协议访问远程服务的接口,提供结构化地址与经纬度之间的相互转化的能力。 结构化地址的定义: 首先,地址肯定是一串字符,内含国家、省份、城市、区县、城镇、乡村、街道、门牌号码、屋邨、大厦等建筑物名称。按照由大区域名称到小区域名称组合在一起的字符。一个有效的地址应该是独一无二的。注意:针对大陆、港、澳地区的地理编码转换时可以将国家信息选择性的忽略,但省、市、城镇等级别的地址构成是不能忽略的。

2017-09-19

python 3.6 scipy包

python 3.6 scipy包 scipy-0.19.0-cp36-cp36m-win_amd64.whl

2017-06-07

python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh

python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh

2017-06-07

python snownlp-0.12.3.tar.gz

python snownlp-0.12.3.tar.gz

2017-06-07

python xlwt3-0.1.2.tar.gz 包

python xlwt3-0.1.2.tar.gz 包

2017-06-07

R语言之RODBC包

RODBC包

2017-01-20

randomForest包

randomForest包

2017-01-20

R-Rwordseg_0.0-1包

R-Rwordseg_0.0-1包

2017-01-20

cw2vec相关资料,cw2vec论文与Word Vectors

cw2vec相关资料,全国知识图谱与语义计算大会(CCKS2018)8月14日至17日在天津举行,凭借出色的专业能力,阿里健康团队在中文电子病历命名实体识别评测任务中夺冠。 cw2vec: (Learning Chinese Word Embeddings with Stroke n-gram Information) AAAI 2018高分录用的一篇中文词向量论文

2010-01-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除