自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一路风景

为了学习的愉悦而读书,为了做事的满足而工作

  • 博客(5)
  • 资源 (14)
  • 收藏
  • 关注

原创 python3爬取<盘龙>英文版(wuxiaworld.com)

闲来无事, 不, 其实我事很多. 但是看到一个好玩的东西就手痒了. www.wuxiaworld.com 国外的中文奇幻小说翻译网站在这个网站上, 我看过且发誓以后再也不会看的 盘龙 赫然在目…思索良久, 本着学习英语, 天天向上的态度, 我决定把它下载下来, 好好把玩一番.但是, 这个网站是不提供下载的, 而且是每一章一个网页. 八百多章, 科科… 于是决定写个爬虫爬下来, 分析一下盘

2016-12-20 20:45:05 8780

原创 TD-IDF在spark中的使用(ml方式)

上一篇 文章提到了TD-IDF的原理和大致使用方式, 现在我写了一个比较完整的例子来展示一下, 该例子包含了数据导入(为了统一, 将文件导入了数据库),处理, 以及结果导出功能.import org.apache.spark.mllib.linalg.Vectorimport com.zte.bigdata.vmax.machinelearning.common.{LogSupport, Crea

2016-12-20 10:56:34 4097 3

原创 TF-IDF原理及使用

一. 什么是TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率). 是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。上述引用总结就

2016-12-18 17:03:50 161407 11

翻译 Spark RDD 到 LabelPoint的转换(包含构造临时数据的方法)

题目: 将数据的某个特征作为label, 其他特征(或其他某几个特征)作为Feature, 转为LabelPoint参考: http://www.it1352.com/220642.html首先构造数据import scala.util.Random.{setSeed, nextDouble}setSeed(1)case class Record(foo: Double, target: D

2016-12-15 21:00:55 9755 3

原创 scala中反射的简单应用

以下是在scala里利用java api写的反射. 之后会更新scala自己的反射机制// A.scala, 存放被反射的类package aaaclass A{ def fun1(a:String) = print(a) def fun2() = print("fun2") val t = 1}//B.scala,主程序入口object B extends App { va

2016-12-02 14:45:10 7330

腾讯桌面整理软件DeskGo独立提取版

很好用的桌面管理软件, 是从腾讯电脑管家里提取出来的

2017-05-19

2017中国大数据发展报告

大数据 发展 报告

2017-04-23

Hadoop-MindMap-思维导图-读书笔记

Hadoop-MindMap-思维导图-读书笔记

2017-04-23

完全用Linux工作

我已经半年没有使用 Windows 的方式工作了。Linux 高效的完成了我所有的工作。 GNU/Linux 不是每个人都想用的。如果你只需要处理一般的事务,打游戏,那么你 不需要了解下面这些了。 我不是一个狂热的自由软件份子,虽然我很喜欢自由软件。这篇文章也不是用来推 行自由软件运动的,虽然我觉得自由软件运动是非常好的。

2012-11-10

win8开始菜单start8破解版

start8破解版,完美支持Windows8,找回原来的开始菜单,亲测非常好用

2012-11-10

visual studio 2010操作教程

visual studio 2010操作教程 适合新手,并非语言教科书,而是vs2010的使用说明

2010-11-30

程序员羊皮卷.pdf

书中涵盖了从如何读大学、怎样求职、应对职场政治到技术人员创业的每 个方面,以程序员的成长为主线,讲述其中遇到的困难和问题以及相应的解决 方法。本书的第 16 章程序员职业规划九大工具箱,还提供了一些具体的操作 方法来帮助大家看清前路、飞越迷雾

2010-11-30

Ubuntu部落:初学者推荐用书

非常经典通俗易懂的ubuntu入门教材,欢迎下载享用

2010-10-20

《Ubuntu_命令技巧手册》

《Ubuntu_命令技巧手册》非常通俗的ubuntu入门教材,经典易懂

2010-10-20

Linux(ubuntu)命令大全

Linux(ubuntu)命令大全 常用ubuntu命令

2010-07-14

搜索引擎:原理、技术与系统

搜索引擎 原理 技术 系统 百度 谷歌 google

2010-07-14

[Visual C++ 2008 入门经典]

vc的入门书籍 我没怎么看过 应该挺好的 哈哈

2009-09-22

dos+概述及入门,标题还不详细吗?

dos呗 最基础的,看着挺好的 给大家分享一下啦

2009-09-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除