自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Blog of Benley

--博、雅、真、精--

  • 博客(3)
  • 资源 (23)
  • 收藏
  • 关注

原创 Python数据挖掘-NLTK文本分析+jieba中文文本挖掘

一、NLTK介绍及安装1.1 NLTK安装NLTK的全称是natural language toolkit,是一套基于python的自然语言处理工具集。nltk的安装十分便捷,只需要pip就可以。相对Python2版本来说,NLTK更支持Python3版本。pip install nltk在nltk中集成了语料与模型等的包管理器,通过在python解释器中执行>>> import...

2018-02-21 00:16:23 31977 2

原创 Python数据挖掘-Python with hadoop

一、SnakeBite1.1 Snakebite介绍介绍:Snakebite由Spotify创建,需要python2 (python3版本目前并不支持) and python-protobuf 2.4.1或更高版本。Snakebite提供了一个Python客户端库,允许客户从Python应用程序中以编程方式访问HDFS。客户端库使用protobuf与NameNode直接通信的消息。snakebit...

2018-02-20 15:16:24 3747 1

原创 Python数据挖掘-支持向量机SVM

本文章内容来自麦子学院课程-机器学习,特此申明。Part One:线性可分的SVM1. SVM 背景 1.1 最早是由Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出 1.2 目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出,并在1995年发表 1.3 深度学习...

2018-02-14 11:33:36 2494 1

美国国家安全局解密特工培训手册:如何利用谷歌等大众搜索工具搜集保密数据

美国国家安全局解密特工培训手册:如何利用谷歌等大众搜索工具搜集保密数据

2014-03-19

移动社会网络的用户访问模型及应用研究

本文通过对前述模型参数的分析,提取两个关键参数指标分别表征移动社会网站的竞争地位与竞争实力,得到了一个移动社会网络生命周期评估模型,可用于评估一个移动社会网站的发展状况。基于实测数据,验证了评估模型的有效性。其次,从用户访问特征、会话特征、与邻居站点关系特征这3大方面分析和讨论了处于不同生命阶段的移动社会网络,其用户的群体行为规律与流量特征。 在访问模型的事务层面上,对用户访问移动社会网络的访问序列进行分析,有助于了解用户群体对网络的使用习惯从而实现访问行为的预测,然而目前尚缺乏对移动社会网用户访问序列的分析。本文在Markov链模型的基础上,给出一个具有“用户感知”的网页推荐模型,能适用于大流量关键节点网页的预测推荐,弥补了以往预测算法无用户感知、需反复训练、难以应用到移动社会网络的问题。基于大量用户访问wap.renren.com的真实数据,验证这个预测模型的有效性与高准确性。

2013-06-11

软件开发笔试面试题总结精华版

个人从CSDN,PUDN等各在论坛总结来的帖子,对于找IT开发类的工作很有帮助。 个人与好友做完这些题后,拿华为、中兴、腾讯、绿盟、运营商等各大公司的Offer表示没有压力。

2013-05-05

国家互联网应急处理中心面试题总结

国家网络应急中心 2013年面试题 事业编制

2013-05-05

IDC网站运营系统说明文档

IDC网站运营系统说明文档,从环境的搭配,安装服务器的参数及工作流程,数据汇集处理与采集器部分5个方面讲述IDC网站运营

2013-05-05

本科C++课程设计(宾馆管理系统)

C++详细开发文档+源代码,本科C++课程设计(宾馆管理系统)

2011-10-29

C#参考文档

290页的PDF微软C#参考文档,为您的C#高质量编程提供参考!

2011-10-29

进入IT类500强外企其实很容易(IT面经总结)

540页Word文档,告诉您:其实进入IT类500强外企其实很容易(IT面经总结)

2011-10-29

Linux实用教程(PPT培训资料)

Linux实用教程(PPT培训资料),为您从基础到深入地讲述Linux开发的实质

2011-10-28

高性能网络爬虫研究

高性能网络爬虫研究,为您讲述网络爬虫的实质!

2011-10-28

Linux_C高级程序员指南(书籍)

Linux_C高级程序员指南(书籍),为您讲述怎样成为高级Linux C程序员的快速路径。

2011-10-28

破解版的寸照生成器

破解版的寸照生成器(很方便使用的!),从此不再为找不到电子证件照烦扰!

2011-10-28

数据仓库与数据挖掘技术(第2版)陈京民课件讲义

数据仓库与数据挖掘技术(第2版)陈京民课件讲义,为您完整讲述数据挖掘应用技术

2011-10-28

WAP编程全书

WAP编程全书,很全面的WAP2.0编程资料,以供参考!

2011-10-28

K-means算法的Matlab实现代码(使用文档+源代码)

K-means算法的Matlab实现代码(使用文档+源代码),直接改写参数运行即可。

2011-10-28

《高质量C++编程指南》林锐

《高质量C++编程指南(林锐)》,相信大家都曾听过,本书很全面的介绍了林锐的编程思维与算法实现

2011-10-28

Matlab概率统计工具箱

很全面的Matlab数学概率统计工具箱大全,适用于做数据分析,及数学电子应用的人们。

2011-10-28

Dos命令大全

有关Dos命令大全整理的文档,供习惯于Dos操作的同学参考。

2011-10-28

SQL语句——句典,菜鸟与高手共用

适用于菜鸟与SQL高手的语句大典,方案解决。

2011-10-28

加权行为特征的智能手机安全监控研究

在分析了病毒行为和正常业务行为的基础上,提出了一种对病毒和业务行为特征加权的智能手机安全监控策略, 通过对程序行为特征的加权计算。 与设定阈值相比较, 中断权值大于阈值的可疑行为 从而达到智能手机业务安全监控的目的。 实验表明该机制是可行有效的

2011-10-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除