《社交网站的数据挖掘与分析》摘要

社交网站的数据挖掘与分析
ISBN
978-7-111-36960-8

https://www.jb51.net/books/633739.html

https://github.com/ptwobrussell/Mining-the-social-web

https://github.com/sixosix/twitter
NLTK:www.nltk.org
cPickle
re
NetworkX:networkx
DOT语言,Graphviz:www.graphviz.org , networkx.lanl.gov/pygraphviz/
Protovis : vis.stanford.edu/protovis/
GVedit
canviz
FOAF
microformats.org
HTMLParser
BeautifulSoup
urllib2
geo格式
mailbox
email
quopri
CouchDB: couchdb、CouchOne、coudant.com
couchdb-lucene
jsonlib2
prettytable
SIMPL Timeline
Redis
local
functools
infochimps.org 
WP-Cumulus
csv
编辑距离Levenshtein、n元语法相似度、雅克比距离、MASI距离
webbrowser
linkdin
geopy
cluster
buzz
TF-IDF
Dumbo
scrapy.org
feedparser
Luhn算法
WordNet
facebook-pyton-sdk
FQL
thejit.org
shutil
Sunburst
operator
cgi.escape
语义网络、推理、Fuxi、N3

《社交网站的数据挖掘与分析(原书第2版)》
前言 1
第一部分 社交网络导引
序幕 13
第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等 15
1.1 概述 15
1.2 Twitter风靡一时的原因 16
1.3 探索Twitter API 18
1.4 分析140字的推文 33
1.5 本章小结 47
1.6 推荐练习 48
1.7 在线资源 48
第2章 挖掘Facebook:分析粉丝页面、查看好友关系等 50
2.1 概述 51
2.2 探索Facebook的社交图谱API 51
2.3 分析社交图谱联系 62
2.4 本章小结 85
2.5 推荐练习 86
2.6 在线资源 86
第3章 挖掘LinkedIn:分组职位、聚类同行等 88
3.1 概述 89
3.2 探索LinkedIn API 89
3.3 数据聚类速成 94
3.4 本章小结 124
3.5 推荐练习 125
3.6 在线资源 126
第4章 挖掘Google+:计算文档相似度、提取搭配等 127
4.1 概述 128
4.2 探索Google+ API 128
4.3 TF-IDF简介 138
4.4 用TF-IDF查询人类语言数据 145
4.5 本章小结 164
4.6 推荐练习 165
4.7 在线资源 165
第5章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等 167
5.1 概述 168
5.2 抓取、解析、爬取网页 168
5.3 通过解码语法来探索语义 174
5.4 以实体为中心的分析:范式转换 192
5.5 人类语言数据处理分析的质量 200
5.6 本章小结 203
5.7 推荐练习 203
5.8 在线资源 204
第6章 挖掘邮箱:分析谁和谁说什么以及说的频率等 206
6.1 概述 207
6.2 获取和处理邮件语料库 207
6.3 分析Enron语料库 225
6.4 探索和可视化时序趋势 241
6.5 分析你自己的邮件数据 244
6.6 本章小结 250
6.7 推荐练习 251
6.8 在线资源 251
第7章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等 253
7.1 概述 254
7.2 探索GitHub的API 254
7.3 使用属性图为数据建模 260
7.4 分析GitHub兴趣图谱 264
7.5 本章小结 286
7.6 推荐练习 287
7.7 在线资源 287
第8章 挖掘带标记语义网:提取微格式、推断资源描述框架等 289
8.1 概述 290
8.2 微格式:易于实现的元数据 290
8.3 从语义标记过渡到语义网:一个小插曲 304
8.4 语义网:发展中的变革 304
8.5 本章小结 310
8.6 推荐的练习 311
8.7 在线资源 311
第二部分 Twitter实用指南
第9章 Twitter实用指南 317
9.1 访问Twitter的API(开发目的) 318
9.2 使用OAuth访问Twitter的API(产品目的) 319
9.3 探索流行话题 323
9.4 查找推文 324
9.5 构造方便的函数调用 325
9.6 使用文本文件存储JSON数据 326
9.7 使用MongoDB存储和访问JSON数据 327
9.8 使用信息流API对Twitter数据管道抽样 329
9.9 采集时序数据 330
9.10 提取推文实体 332
9.11 特定的推文范围内查找最流行的推文 333
9.12 特定的推文范围内查找最流行的推文实体 335
9.13 对频率分析制表 336
9.14 查找转推了状态的用户 337
9.15 提取转推的属性 339
9.16 创建健壮的Twitter请求 340
9.17 获取用户个人资料信息 343
9.18 从任意的文本中提取推文实体 344
9.19 获得用户所有的好友和关注者 345
9.20 分析用户的好友和关注者 347
9.21 获取用户的推文 348
9.22 爬取好友关系图 350
9.23 分析推文内容 351
9.24 提取链接目标摘要 353
9.25 分析用户收藏的推文 356
9.26 本章小结 357
9.27 推荐练习 358
9.28 在线资源 359
第三部分 附录
附录A 关于本书虚拟机体验的信息 363
附录B OAuth入门 364
附录C Python和IPython Notebook的使用技巧 368

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
社交媒体数据挖掘分析是指通过对社交媒体平台上的数据进行收集、整理、分析和挖掘,从中提取有价值的信息和知识。这种方法在传统的市场调研和数据分析中起到了至关重要的作用。 首先,社交媒体数据挖掘分析可以帮助企业了解他们的受众。通过收集社交媒体上用户的言论、行为和偏好,企业可以更好地了解目标用户的兴趣和需要,从而进行更精准的市场定位和产品设计。 其次,社交媒体数据挖掘分析可以帮助企业进行舆情监测和危机管理。通过实时监控社交媒体上的舆情动态,企业可以及时了解公众对其品牌和产品的看法和评价,提前嗅到潜在的危机并采取相应的措施,保护企业的声誉和利益。 此外,社交媒体数据挖掘分析也可以为企业提供竞争情报。通过分析竞争对手在社交媒体上的表现和策略,企业可以了解对手的优势和劣势,并相应调整自己的市场策略,提升竞争力。 最后,社交媒体数据挖掘分析还可以帮助企业进行用户画像和个性化推荐。通过分析用户在社交媒体上的活动和关注点,企业可以获取用户的喜好和需求,并基于此进行个性化推荐和定制化服务,提升用户满意度和忠诚度。 综上所述,社交媒体数据挖掘分析是一种利用社交媒体上的数据进行信息提取和知识挖掘的方法,广泛应用于市场调研、舆情监测、竞争情报和个性化推荐等领域,对企业在市场竞争中的决策和运营都具有重要意义。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值