音乐站信息挖掘本质

最新推荐文章于 2023-12-28 22:02:44 发布

weixin_34337381

最新推荐文章于 2023-12-28 22:02:44 发布

阅读量88

点赞数

原文链接：http://blog.51cto.com/spider001/164333

版权

纵观百度MP3的数据，发现来源就那么几个站。

谷歌采用正版人工的歌曲大概30多万。

两大搜索引擎都有收入歌不足问题。

基于本文的理念基本能够充分扩大和更新信息和资源，

起码超过他们是没有问题的，实践已经证明。

做搜索，对于歌曲的信息获取，根据大量站点

和实际数据证明，现阶段，音乐站本质信息提

取，有两类页面，专辑信息页和试听页。如果

能够充分获取这两类页的信息，是可以解决绝

大部分歌曲信息抽取和覆盖面。本文只谈信息

提取，不谈资源下载，资源下载当然能够解决，

并且已经解决和试验。

音乐信息分老的和新的，老的可以基于这两类

页遍历获取，那么新的和将有的如何处理呢？

同样基于这两类实时更新。

至于怎么抽取有用信息，这就要根据各个搜索

引擎现状和环境决定。但大体一样，详细步骤

就不说了，只是把这个方法理念提出来，希望

多多批评指正；已实现这个理念，实践证明效果

不错。

转载于:https://blog.51cto.com/spider001/164333

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34337381

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

数据挖掘实战-基于word2vec的短文本情感分析

m0_64336780的博客

11-30

2万+

Word2vec 是 Word Embedding 的方法之一。他是 2013 年由谷歌的 Mikolov 提出的一套新的词嵌入方法，是一种神经网络概率语言模型，可以用于计算单词的词向量。与传统的高维词向量 one-hot representation 相比，Word2vec 词向量的维度通常在 100~300 维之间，减少了计算的复杂度，也不会造成向量维数灾难。除此之外，Word2vec词向量是根据词汇所在上下文计算出的，充分捕获了上下文的语义信息，很容易通过它计算两个词汇的相似程度。

当前音乐推荐系统研究中的挑战和愿景

09-21

4567

近年来，由于在线流媒体服务的出现和成功，音乐推荐系统（MRS）经历了飞速发展，如今，在线推荐服务几乎可以使所有音乐触手可及。尽管当今的MRS可以极大地帮助用户在这些庞大的目录中找到有趣的音乐，但MRS的研究仍面临着严峻的挑战。特别是在构建、合并和评估推荐策略时，这些策略除了将信息整合到简单的用户物品交互、基于内容表达之外，还需要深入挖掘听众的需求、偏好和意图的本质。MRS研究成为很大的努力方向，但相关的出版物却很少。此趋势和调查文章的目的是双重的。

参与评论您还未登录，请先登录后发表或查看评论

基于 Web 的数据挖掘

blog of eulota

10-06

4978

基于 Web 的数据挖掘英文原文内容：HTML：优点与缺点背景技术方法概述获取 XHTML 格式的源信息查找数据的引用点将数据映射成 XML

关于数据挖掘（协同过滤、关联推荐、聚类分类）一些资料

JesseChan's Blog

11-03

1590

好多资料一直没有整理啊，呵呵2002年的时候就一直接触这个方向，可惜有一段时间做的工作与这个相关不大，所以那段时间一直也就只能业余看看了，不过感觉这个东西一直和我还是比较有缘的！协同过滤关联推荐的话目前大家可以参考亚马逊网上书店的效果，总感觉当当网什么都没有给我推荐过滤过，倒是China-Pub命中过一次（置信度100%啊，只向我推荐过一次 :) 就忽悠我把《什么是数学》给买下来了，还

《中国人工智能学会通讯》——11.7 场景化个性化的地理位置推荐系统

weixin_34238642的博客

09-04

195

数据挖掘分类算法详解

china1000的专栏

10-17

9238

待续

智能推荐系统

小福子的专栏

03-17

1400

亚马逊的CEO Jeff Bezos曾经说过，他的梦想是“如果我有100万个用户，我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想，即通过数据挖掘技术，为每一个用户实现个性化的推荐结果，让每个用户更便捷的获取信息。为了实现这个梦想，过去十余年间，无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中，很多优秀的方法被提出，很多技术难题被攻克。在今天的互联网应用中，越来越多“

是什么打动了您的内心世界？ —音乐情感分析的特征挖掘

02-25

音乐情感分析是指通过信息技术手段对音乐内容进行情感特征的提取和分析，以便了解和解读音乐如何影响和表达情感。音乐作为一种艺术形式，不仅仅是一种娱乐手段，它还能够在某种程度上唤起人们强烈的情感反应。心理学...

数据挖掘：理论与算法学习笔记

最新发布

m0_52899614的博客

12-28

1950

后剪枝则是先从训练集中生成一棵完整的决策树，然后自底向上的考察每一个非叶结点，和预剪枝相反，如果将该结点对应的子树替换为叶结点能给决策树带来性能上的提升，则将该子树替换为叶结点。原理：根据特征的先验概率（训练样本分析得到的概率），利用贝叶斯公式计算出其后验概率（要分类对象特征的条件概率），选择概率值最大的类作为该特征所属的类。信息增益越大越好，即该属性的效能越高，越有区分度。Elman Network：此算法有一定的记忆性，通过之前的输入推出答案，输出不仅仅取决于当前的输入，还取决于之前的输入。

spark数据挖掘 - 基于 Audioscrobbler 数据集音乐推荐实战

chengtuo5899的博客

10-30

1383

基于 Audioscrobbler 数据集音乐推荐实战 1. 数据集这个例子将使用 Audioscrobbler 公开的数据集。Audioscrobbler是http://www.last.fm/zh/第一个音乐推荐系统. http://www.last.fm/zh/ 是第一个网络流媒体音频...

陌陌: 基于地理位置的陌生人社交平台

09-07

654

陌陌是一个基于地理位置信息的陌生人交友平台，创新的在产品设计中融入了独特的社交模式。陌陌是一个基于地理位置信息的陌生人交友平台，创新的在产品设计中融入了一些独特的社交模式。核心是，通过GPS搜寻和定位身边的陌生人，为路人甲和路人乙搭建一个高效便捷的建立联系的通路，并在此基础上以一种...

在GAE之中使用基于地理位置的查询

weixin_34185364的博客

04-04

126

当我决定将我的数据上传到GAE上的时候，我就预计到将来的数据调用将会是非常费劲的，果然，我现在仅仅是小小的使用了一下自己的数据就已经把自己折磨的够呛，因为GAE不能支持联合查询，在数据的排序和条件上也有诸多限制，因此，操作起来非常费劲，甚至有时候必须牺牲一些性能或效果。本文对那些问题不做详细的表述，仅仅谈谈我进行地理数据查询的实现。将地理的数据存储到Google的D...

mongodb中地理位置信息类型及性能初探

ALDRIDGE1的专栏

04-27

1622

Posted on February 26, 2013 by liubin 1. 问题的引出前两天说到LBS系统里如何找到附近的点，假如数据库存储如下信息{x,y}分表表示经度和纬度（这里统统存为正数，方便计算），那么如果取得当前位置信息(x1,y1)如何去数据库里查附近的信息（记录）呢？最原始的想法差不多是： 1 2 3 4 5 sel

Solr4.7实现LBS(地理位置搜索）

mtou

03-24

191

solr实现LBS(地理位置搜索）有两种方式：Cartesian Tiers 笛卡尔层和 GeoHash算法，本文主要介绍GeoHash算法实现。实现步骤： 1. 修改schema.xml文件 <fieldtype name="geohash" class="solr.GeoHashField"/> <field name="geohashTest"...

LBS的概念、历史、现状与未来之三--LBS的机会与挑战

weixin_34194317的博客

11-13

1032

（本文部分内容为梳理网络资料）一、LBS的发展方向 ● 整合型地理位置签到服务整合型地理位置签到服务（location check-in aggregator）是指可以将地理位置信息同时签到到多个地理位置服务的网站，这类服务的出现是伴随着大量类Foursuare的出现而出现，目前的类Foursuare服务包括：Brightkite, Gowalla以及Facebo...

零售商如何利用库存再分配挖掘利润点

weixin_33812433的博客

09-01

144

本文讲的是零售商如何利用库存再分配挖掘利润点,在今年的315消费者权益日中，网络购物退货成为热议话题。随着国家工商总局《侵害消费者权益行为处罚办法》的正式实施，网购消费者权利得到升级，而零售商未来则将不可避免地面对更多退货方面的诸多挑战。　　随着电子商务在中国的迅速崛起，零售业态已经发生了巨大的变革。一方面得益于电商平台及技术的日益成熟，网络购物成为轻...

聚类算法应用场景实例十则