anu77781
码龄10年
关注
提问 私信
  • 博客:8,220
    8,220
    总访问量
  • 暂无
    原创
  • 1,979,663
    排名
  • 3
    粉丝
  • 0
    铁粉
  • 加入CSDN时间: 2014-11-13
博客简介:

anu77781的博客

查看详细资料
个人成就
  • 获得5次点赞
  • 内容获得0次评论
  • 获得46次收藏
创作历程
  • 1篇
    2017年
  • 9篇
    2016年
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Python爬虫一:爬取上交所上市公司信息

  前几天领导让写一个从新闻语料中识别上市公司的方案。上市公司属于组织机构的范畴,组织机构识别属于命名实体识别的范畴。命名实体识别包括人名、地名、组织机构等信息的识别。 要想从新闻语料中识别上市公司就需要有上市公司的先验信息。趁着周末在家没重要事情,顺手写了个爬虫,爬取了上海交易所的上市公司的信息。 好吧,废话不多说直接上代码。说明:本次代码是一次性的,还有优化...
转载
发布博客 2017.05.19 ·
1757 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

Spark Streaming与kafka整合实践之WordCount

本次实践使用kafka console作为消息的生产者,Spark Streaming作为消息的消费者,具体实践代码如下首先启动kafka server.\bin\windows\kafka-server-start.bat .\config\server.properties创建一个Topic此处topic名以test为例kafka-topics.bat --crea...
转载
发布博客 2016.11.17 ·
207 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Scala学习笔记之:tuple、array、Map

目录 tuple学习笔记 tuple的定义 tuple的访问 拉链操作:zip array学习笔记 数组要点 定长数组 变长数组 遍历数组和数组缓冲 数组转换 ...
转载
发布博客 2016.11.16 ·
187 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

在Windows环境中安装并使用kafka

目录 安装部署 安装部署Java 安装zookeeper 使用kafka kafka常用命令 参考文献 安装部署安装部署Java下载需要安装的软件,下载地址:http://www.or...
转载
发布博客 2016.11.11 ·
195 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

scala中常用但其他语言不常见的符号含义

本文旨在介绍Scala在其他语言中不太常见的符号含义,帮助理解Scala Code。随着我对Scala学习的深入,我会不断增加该篇博文的内容。修改记录----2016.11.23 新增scala中最神秘强大的下划线(_)用处下面介绍Scala中的符号::::三个冒号运算符:表示list的连接操作val one = List(1,2,3)va...
转载
发布博客 2016.11.04 ·
154 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

从零开始学Hadoop系列之File System命令一

1、Overview  文件系统(FS)shell包含多种能直接与HDFS(Hadoop Distributed File System)及Hadoop支持的其他文件系统,例如Local FS,HFTP FS,S3 FS等进行直接交互的命令。FS shell由bin/hadoop fs <args>发起。 所有的FS shell都将URI作为参数。URI的形式...
转载
发布博客 2016.11.01 ·
196 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

27个Jupyter Notebook使用技巧及快捷键(翻译版)

Jupyter Notebook  Jupyter Notebook 以前被称为IPython notebook。Jupyter Notebook是一款能集各种分析包括代码、图片、注释、公式及自己画的图一体的灵活工具。  Jupyter 具有可扩展性。它支持多种语言,能容易的部署到自己的计算机或远程服务器上。用户只要通过ssh或http就能访问远程的Jupyter。更赞的是Jup...
转载
发布博客 2016.10.20 ·
4101 阅读 ·
5 点赞 ·
0 评论 ·
39 收藏

27个Jupyter快捷键、技巧(原英文版)

本文是转发自:https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/ 的一篇文章,先记录在此,等有空时我会翻译成中文。如果有读者看到该文,支持看原文。原文内容如下:27 Jupyter Notebook tips, tricks and shortcuts12 OCT 2016in...
转载
发布博客 2016.10.19 ·
870 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

搭建HWI(HiveWebInterface)步骤总结

  众所周知,Hive有三种使用方式:CLI、HWI浏览器、Thrift客户端。安装配置完Hive后无需进行额外操作即可使用CLI。但是HWI则需要单独搭建。本文主要记录我自己搭建HWI的过程。  说明:本文主要介绍HWI的安装,后续会完成下面两篇博文:HWI的介绍HWI的使用  本博主主要是记录自己的学习内容,有哪些理解不到位的地方还请各位读者提出宝贵意见。...
转载
发布博客 2016.11.04 ·
425 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

intellij安装Scala及Python插件

1、下载intellij及Scala和Python插件  intellij的下载地址:https://www.jetbrains.com/idea/download/#section=windows Scala插件下载地址:https://plugins.jetbrains.com/plugin/1347?pr=idea Python插件下载地址:ht...
转载
发布博客 2016.11.02 ·
127 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏