自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据技术派

代码改变世界,代码改变命运! | 微信搜索:大数据技术派

  • 博客(7)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

转载 R语言文本分词之——结巴分词

"结巴"中文分词的R语言版本,支持最大概率法,隐式马尔科夫模型,索引模型,混合模型,共四种分词模式,同时有词性标注,关键词提取,文本Simhash相似度比较等功能。项目使...

2017-12-31 20:15:49 2972 1

原创 R语言文本分词之——Rwordseg包

Rwordseg是一个R环境下的中文分词工具,使用 rJava 调用 Java 分词工具 Ansj,所以需要安装并且配置java环境(也就是jdk)。Ansj 也是一个...

2017-12-29 12:17:59 959

转载 梯度下降算法

梯度下降法是一个最优化算法,通常也称为最速下降法。最速下降法是求解无约束优化问题最简单和最古老的方法之一,虽然现在已经不具有实用性,但是许多有效算法都是以它为基础进行改进...

2017-12-27 23:19:53 513

转载 R语言中apply家族中的系列循环函数总结

R语言中的以apply()函数为首的apply()家族,提供了强大而方便的循环功能,这些函数说起来简单,用起来可能就有点蒙圈儿了。这些函数确实简单,但是可能很多人搞不清这...

2017-12-23 22:03:07 1167

转载 数据分析应该学什么语言——R语言极具潜力

数据平台 Kaggle 近日发布了2017 机器学习及数据科学调查报告,这也是Kaggle 首次进行全行业调查,调查共收到超过 16000 份回复,表明样本足够大,可...

2017-12-23 22:03:07 414

转载 想画出你家乡地图吗

看到各种各样漂亮的地图有没有很羡慕,那么这些地图究竟是怎么画出来的呢,这里主要介绍两个画地图的R包。一、leafletCN1、包的下载与安装下载:...

2017-12-15 21:35:48 1170

转载 R实现几种简单的聚类分析

有句话说得好:物以类聚,人以群分;而聚类分析就是要把这样的“类”和“群”找出来。聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。比如两个人都喜欢...

2017-12-13 22:43:19 3564

Zookeeper单机环境和集群环境搭建

Zookeeper单机环境和集群环境搭建

2023-06-15

虚拟机静态IP及多IP配置

虚拟机静态IP及多IP配置

2023-06-15

基于Zookeeper搭建Kafka高可用集群

基于Zookeeper搭建Kafka高可用集群

2023-06-15

基于Zookeeper搭建Hadoop高可用集群

基于Zookeeper搭建Hadoop高可用集群

2023-06-15

Storm集群环境搭建

Storm集群环境搭建

2023-06-15

Spark开发环境搭建

Spark开发环境搭建

2023-06-15

Spark集群环境搭建

Spark集群环境搭建

2023-06-15

Linux下Python安装

Linux下Python安装

2023-06-15

Linux下JDK安装

Linux下JDK安装

2023-06-15

Linux下Flume的安装

Linux下Flume的安装

2023-06-15

Linux环境下Hive的安装部署

Linux环境下Hive的安装部署

2023-06-15

HBase集群环境搭建

HBase集群环境搭建

2023-06-15

Hadoop集群环境搭建

Hadoop集群环境搭建

2023-06-15

docker 安装 wordpress,通过nginx反向代理,绑定域名,配置https

docker 安装 wordpress,通过nginx反向代理,绑定域名,配置https

2023-06-15

5分钟安装docker教程

5分钟安装docker教程

2023-06-15

2022年Python爬虫最全资料【6年爬虫经验精华总结】

【主要内容】 1. Python爬虫简介与环境安装 - Pythonn环境 - Selenium安装 - Python相关包 2. 基本库的使用 - 爬虫基本原理; - urlib库使用; - requests库使用; - bs4使用; - xpath和lxml使用; - selenium使用; - PyQuery使用; 3. scrapy基本使用 4. Scrapy redis实现分布式爬虫 5. 反爬措施 6. 手机APP爬虫 - 模拟器安装、fiddler、appium、mitmproxy安装; - 抓包工具的使用; - 移动端自动化控制; - 利用mitmproxy抓取存储数据; - apk脱壳反编译; references,学习资料分享 价格可谈,联系我:ddxygq。

2022-07-07

阿里巴巴java开发手册中文版

阿里巴巴java开发手册,高清原版,规范你的java开发习惯,让你的开发习惯与顶级互联网公对齐!

2018-09-02

hive-hbase-handler-1.2.1.jar

hive-hbase-handler-1.2.1.jar解决hive1.2.1,hbase不兼容情况!

2018-08-15

hadoop-2.7.2 windows7环境编译文件(winutils.exe、hadoop.dll)

windows环境下开发hadoop与本地运行,会报错,需要编译win环境hadoop工具 否则,可能会有两种错误: 1、Did not find winutils.exe: java.io.FileNotFoundException; 2、java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows 将里面的bin目录覆盖到hadoop对应bin目录即可

2018-03-07

用matlab编写猜字小游戏

用matlab编写猜字小游戏

2016-10-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除