- 博客(16)
- 资源 (20)
- 问答 (1)
- 收藏
- 关注
原创 python下Kafka 教程系列(二)安装与基本操作
kafkakafka简介(摘自百度百科) 简介: afka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方...
2018-05-31 19:10:40 7187 3
原创 redis基本操作命令整理ING
服务器相关命令 命令 介绍 select database 选择数据库(Redis 数据库编号从 0~15) quit 退出 echo msg 打印msg dbsize 返回当前数据库中 key 的数目` info 获取服务器的信息和统计 flushdb 删除当前选择数据库中的所有 key flush...
2018-05-31 14:34:31 722
原创 Redis之MISCONF Redis is configured to save RDB snapshots错误
操作redis过程中并没有修改什么配置,出现如下错误, Redis之MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk. Commands that may modify the data set are disabled. Please check Red...
2018-05-30 23:01:32 2095
原创 日常电脑操作小技能篇(生活无处不精彩)
温馨提示,如果你有更好的方法欢迎留言分享大文件预览1.当我们处理大数据过程中,数据量特别的大,比如有如下文件达到800M, 使用记事本或者是Notepad均打不开。 那么我们又要查看数据,又不想写程序查看,可以在cmd中执行如下type C:\Users\lenovo\Desktop\NewShortestPathCountrywideComplete.txt操作流...
2018-05-29 10:17:48 1511
原创 深度学习入门(一),从Keras开始
深度学习:Keras入门(一)之基础篇安装keras1.关于Keras2.Keras的模块结构3.使用Keras搭建一个神经网络4.基本概念5.第一个示例安装keras安装环境:Anaconda(python3.6) 首先安装:tensorflow.(通过navigator,可参见直通车) 检验:import tensorflow as t...
2018-05-22 11:18:06 5529 1
原创 python之协程的那些事
python如何设置多进程(直通车)协程基本概念协程,又称微线程,纤程。英文名Coroutine。协程是一种用户态的轻量级线程。协程原理协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次...
2018-05-21 10:58:28 1020
原创 程序员进阶之路之面试题与笔试题集锦(三)线上编程题
来源:网易1.奇数偶数问题小易准备去魔法王国采购魔法神器,购买魔法神器需要使用魔法币,但是小易现在一枚魔法币都没有,但是小易有两台魔法机器可以通过投入x(x可以为0)个魔法币产生更多的魔法币。 魔法机器1:如果投入x个魔法币,魔法机器会将其变为2x+1个魔法币 魔法机器2:如果投入x个魔法币,魔法机器会将其变为2x+2个魔法币 小易采购魔法神器总共需要n个魔法币,所以小易只能通过...
2018-05-16 16:33:43 1451
原创 windows下Bitnami Redmine的安装
项目管理工具是团队开发过程中必不可少的工具,比较流行的包括JIRA、trac、redmine、xplanner等。redmine系统以其轻量、易上手等特点吸引了越来越多人的注意,作为其特色的甘特图,也为其赢得了更多的称赞和口碑。 公司要进行敏捷开发管理,最后选择Redmine作为管理工具。 redmine是一个支持中文的开源项目管理系统,基于Ruby on Rails,支持功能灵活而丰富:多项目...
2018-05-12 13:58:49 4755
原创 从零到一spark进阶之路(一)
从零到一spark进阶之路(一)1.RDDRDD是spark特有的数据模型,谈到RDD就会提到什么弹性分布式数据集,什么有向无环图,本文暂时不去展开这些高深概念。(0)随便找个点理解以下最重要的记住,RRD是不可变的,也就是说,已有的RDD不能被修改或者更新,但可以从已有的RDD转化成一个新的RDD.上面的特性解读: RDD可以cache到内存中,每次对RDD数据集的操作...
2018-05-11 17:54:11 1609
原创 python下的pyspark报错集锦
1.WARN Utils: Service ‘SparkUI’ could not bind on port 4040. Attempting port 4041.出现这种错误是是在spark启动从节点时出现的。 解决的方法是,在spark-env.sh中加入一条 SPARK_LOCAL_IP=127.0.0.1 然后就完美解决报错了! D:\spark\spark-2.2.0-bin...
2018-05-11 17:10:05 4338
原创 程序员进阶之路之面试题与笔试题集锦(一)
一、数据结构-算法的时间复杂度和空间复杂度在编程题之前,首先我们先来聊聊时间复杂度:算法复杂度分为时间复杂度和空间复杂度。其作用: 时间复杂度是指执行算法所需要的计算工作量;而空间复杂度是指执行这个算法所需要的内存空间。(算法的复杂性体现在运行该算法时的计算机所需资源的多少上,计算机资源最重要的是时间和空间(即寄存器)资源,因此复杂度分为时间和空间复杂度)。 简单理解: (1)时间复杂...
2018-05-11 13:03:33 2969
原创 GBDT分解形式理解,整理中2018-5-10
GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于搜索排序的机器学习模型而引起大家关注。GBDT主...
2018-05-10 13:10:13 573
原创 python数据预处理之将类别数据转换为数值的方法
在进行python数据分析的时候,首先要进行数据预处理。有时候不得不处理一些非数值类别的数据,嗯, 今天要说的就是面对这些数据该如何处理。目前了解到的大概有三种方法:1,通过LabelEncoder来进行快速的转换;2,通过mapping方式,将类别映射为数值。不过这种方法适用范围有限;3,通过get_dummies方法来转换。import pandas as pdf...
2018-05-08 12:16:36 15741
原创 随机森林(Random Forest) 参数解读
基本原理随机森林(Random Forest)基本原理参考:https://blog.csdn.net/hhtnan/article/details/54580994#A. max_features:随机森林允许单个决策树使用特征的最大数量。 Python为最大特征数提供了多个可选项。 下面是其中的几个:Auto/None :简单地选取所有特征,每颗树都可以利用他们。这种情...
2018-05-08 11:33:57 11738 1
Scalable Modified Kneser-Ney Language Model Estimation语言模型PPT
2018-11-19
基于深度学习的中文机构名识别研究-一种汉字级别的循环神经网络方法
2018-10-19
mabaXterm ssh linux连接工具,一个非常好用的工具
2018-08-03
数学建模模板(建模论文竞赛标准版)
2018-01-13
window_mongodb执行过程个人笔记——不建议下载.txt
2017-10-17
pagerank算法英文文档
2017-09-20
基于最小领域知识的主题建模 :Topic Modeling with Minimal Domain Knowledge
2017-09-19
TextRank算法的参考资料论文
2017-09-19
高德地图API POI分类编码表
2017-09-19
python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh
2017-06-07
cw2vec相关资料,cw2vec论文与Word Vectors
2010-01-11
一个网站之前可以访问,没有做任何处理,现在报错500,麻烦帮忙看下,不知如何解决
2017-10-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人