计算思维第5章 网络化思维

前言回顾

        数据库系统包括:数据库;数据库管理系统;数据库管理员;数据库应用。
        DBMS提供:DDL;DML;DCL。
        数据模型的三要数包括:数据结构;数据操作;完整性约束。
        数据挖掘的任务包括:关联分析;分类预测;聚类分析;异常分析。
        决策树分类算法选择测试属性的依据是:信息增益。

目录

一、World Wide Web

        1.Web应用程序

二、搜索引擎

        1.PageRank算法

三、推荐服务

        1.基于用户的协同过滤

一、World Wide Web

        B/S (Browser/Server,浏览器/服务器)结构
        URL (Uniform Resource Locator,统一资源定位)
        协议://服务器:端口/路径/文档

        1.Web应用程序

        Web应用程序:一个包含许多Web文档、Web文档中涉及的多媒体文件等资源的Web网站。
        Web网站:包括Web服务器与Web应用程序服务器等,例如:IIS (Internet信息服务器)、.NET Framework (.NET框架)、DBMS (数据库管理系统)。
        Web文档:
                页面内容,例如:文字、图片、音频、视频、文件;
               
客户端程序,例如:HTML超文本标记语言+ CSS层叠样式表,JavaScript脚本语言+ 浏览器对象;
               
服务器端程序,例如:C# + ASP.NET。

      与C/S结构相比,B/S结构的优点是:使用范围强;维护升级比较简单。

二、搜索引擎

        1.PageRank算法

        PageRank算法:通过链接分析,估计网页质量 (重要性)
               
反向链接越多越重要——网页“投票数”;
                重要度高的反向链接越重要——网页“重要度”;
                网页重要度等于其所有反向链接的权值和;
                正向链接的权值等于网页重要度除以其正向连接数

                属于
随机游走模型
        假设有n个网页,其重要度为R = [ R1,R2,… ,Rn ]^T,正向链接数为C=[ c1,c2,… ,cn ],那么链接转移概率矩阵为:

        网页重要度计算如下:
        初始:R^0 = [1/n,1/n,… ,1/n ]^T
        迭代:

      搜索引擎的子系统分别为:数据抓取子系统;链接分析子系统;内容索引子系统;内容检索子系统。
        数据抓取子系统:及时、高效地收集数量尽可能多的有用的万维网页面,以及建立它们之间的超链接关系;
        链接分析子系统:基于链接机构分析评价数据质量,基于连接结构分析扩展文档描述;
        内容索引子系统:充分利用系统资源和高效完成索引服务;
        内容检索子系统:利用内容索引子系统提供的索引数据和链接分析子系统提供的分析结果,按照用户的查询信息需求返回以相关度进行排序的结果列表,以便用户进一步浏览和利用。

三、推荐服务

        推荐系统由三个模块组成:用户建模模块;推荐对象建模模块;推荐算法模块。
        用户建模模块:根据用户行为数据和用户属性数据分析用户特征 (兴趣和需求);
        推荐对象建模模块:根据对象与用户的交互数据和对象属性数据分析对象特征;
        推荐算法模块:基于用户特征和对象特征,采用推荐算法计算用户可能感兴趣的对象,并根据推荐场景对推荐结果进行过滤、调整,将最终推荐结果展示给用户。

        1.基于用户的协同过滤

        算法思想:符合人们堆区“趣味相投”的认知,即兴趣相似的用户往往物品偏好相似。当向目标用户进行个性化推荐时,首先找到和目标用户兴趣相似的用户群体,然后将用户群体喜欢的而目标用户没有的物品推荐给目标用户。
        算法步骤:
        ①找到和目标用户兴趣相似的相似用户集合并排序;
        ②找到相似用户喜欢的而目标用户没有的推荐物品集合并排序。
        算法核心:
        度量用户相似性——余弦相似性:

        度量物品兴趣度
        采用相似用户的相似性作为权重;采用相似用户的加权兴趣度估计目标用户的兴趣度。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱睡觉的panda

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值