自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 Python爬虫一:爬取上交所上市公司信息

  前几天领导让写一个从新闻语料中识别上市公司的方案。上市公司属于组织机构的范畴,组织机构识别属于命名实体识别的范畴。命名实体识别包括人名、地名、组织机构等信息的识别。 要想从新闻语料中识别上市公司就需要有上市公司的先验信息。趁着周末在家没重要事情,顺手写了个爬虫,爬取了上海交易所的上市公司的信息。 好吧,废话不多说直接上代码。说明:本次代码是一次性的,还有优化...

2017-05-19 11:50:00 1708

转载 Spark Streaming与kafka整合实践之WordCount

本次实践使用kafka console作为消息的生产者,Spark Streaming作为消息的消费者,具体实践代码如下首先启动kafka server.\bin\windows\kafka-server-start.bat .\config\server.properties创建一个Topic此处topic名以test为例kafka-topics.bat --crea...

2016-11-17 10:05:00 195

转载 Scala学习笔记之:tuple、array、Map

目录 tuple学习笔记 tuple的定义 tuple的访问 拉链操作:zip array学习笔记 数组要点 定长数组 变长数组 遍历数组和数组缓冲 数组转换 ...

2016-11-16 16:15:00 176

转载 在Windows环境中安装并使用kafka

目录 安装部署 安装部署Java 安装zookeeper 使用kafka kafka常用命令 参考文献 安装部署安装部署Java下载需要安装的软件,下载地址:http://www.or...

2016-11-11 15:10:00 178

转载 scala中常用但其他语言不常见的符号含义

本文旨在介绍Scala在其他语言中不太常见的符号含义,帮助理解Scala Code。随着我对Scala学习的深入,我会不断增加该篇博文的内容。修改记录----2016.11.23 新增scala中最神秘强大的下划线(_)用处下面介绍Scala中的符号::::三个冒号运算符:表示list的连接操作val one = List(1,2,3)va...

2016-11-04 17:30:00 141

转载 搭建HWI(HiveWebInterface)步骤总结

  众所周知,Hive有三种使用方式:CLI、HWI浏览器、Thrift客户端。安装配置完Hive后无需进行额外操作即可使用CLI。但是HWI则需要单独搭建。本文主要记录我自己搭建HWI的过程。  说明:本文主要介绍HWI的安装,后续会完成下面两篇博文:HWI的介绍HWI的使用  本博主主要是记录自己的学习内容,有哪些理解不到位的地方还请各位读者提出宝贵意见。...

2016-11-04 10:05:00 406

转载 intellij安装Scala及Python插件

1、下载intellij及Scala和Python插件  intellij的下载地址:https://www.jetbrains.com/idea/download/#section=windows Scala插件下载地址:https://plugins.jetbrains.com/plugin/1347?pr=idea Python插件下载地址:ht...

2016-11-02 10:54:00 115

转载 从零开始学Hadoop系列之File System命令一

1、Overview  文件系统(FS)shell包含多种能直接与HDFS(Hadoop Distributed File System)及Hadoop支持的其他文件系统,例如Local FS,HFTP FS,S3 FS等进行直接交互的命令。FS shell由bin/hadoop fs <args>发起。 所有的FS shell都将URI作为参数。URI的形式...

2016-11-01 14:04:00 188

转载 27个Jupyter Notebook使用技巧及快捷键(翻译版)

Jupyter Notebook  Jupyter Notebook 以前被称为IPython notebook。Jupyter Notebook是一款能集各种分析包括代码、图片、注释、公式及自己画的图一体的灵活工具。  Jupyter 具有可扩展性。它支持多种语言,能容易的部署到自己的计算机或远程服务器上。用户只要通过ssh或http就能访问远程的Jupyter。更赞的是Jup...

2016-10-20 16:02:00 3962

转载 27个Jupyter快捷键、技巧(原英文版)

本文是转发自:https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/ 的一篇文章,先记录在此,等有空时我会翻译成中文。如果有读者看到该文,支持看原文。原文内容如下:27 Jupyter Notebook tips, tricks and shortcuts12 OCT 2016in...

2016-10-19 09:45:00 849

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除