自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

种一棵树最好的时间是十年前,其次是现在

  • 博客(25)
  • 资源 (42)
  • 收藏
  • 关注

原创 剑指offer No.43 左旋转字符串

题目描述汇编语言中有一种移位指令叫做循环左移(ROL),现在有个简单的任务,就是用字符串模拟这个指令的运算结果。对于一个给定的字符序列S,请你把其循环左移K位后的序列输出。例如,字符序列S=”abcXYZdef”,要求输出循环左移3位后的结果,即“XYZdefabc”。是不是很简单?OK,搞定它!public class Solution { public String Left...

2020-04-29 18:42:03 579

原创 《乌合之众:大众心理研究》读书笔记

乌合之众:大众心理研究》以18世纪的法国大革命为背景,通过深刻的观察、对比和研究,极为详细地描述了群体从野蛮人到民族的兴衰,从集群部落到革命暴动的感情、道德观、想象力、信念和群体的分类及其特点等,探讨了群体在种族或民族的兴衰过程中所扮演的重要角色,为众多常见而令人称奇的社会现象及群体行为提供了很好的观察和理解视角。勒庞在书中对群体性格特征的预测已经得到了后世的印证,具有很高的理论和实践价值。每...

2020-04-27 20:22:31 2079

原创 剑指offer No.41 和为S的连续正数序列

题目描述小明很喜欢数学,有一天他在做数学作业时,要求计算出9~16的和,他马上就写出了正确答案是100。但是他并不满足于此,他在想究竟有多少种连续的正数序列的和为100(至少包括两个数)。没多久,他就得到另一组连续正数和为100的序列:18,19,20,21,22。现在把问题交给你,你能不能也很快的找出所有和为S的连续正数序列? Good Luck!输出描述:输出所有和为S的连续正数...

2020-04-27 00:41:46 523

原创 剑指offer No.40 数组中只出现一次的数字

https://www.nowcoder.com/practice/e02fdb54d7524710a7d664d082bb7811?tpId=13&tqId=11193&tPage=2&rp=2&ru=/ta/coding-interviews&qru=/ta/coding-interviews/question-ranking题目描述一个整型数组...

2020-04-27 00:37:55 649

原创 python计算二次方程的实根

1、python计算二次方程的实根程序#计算二次方程的实根程序import mathdef fun(): print("This program finds the real solutions to a quadraic\n") a,b,c=eval(input("please enter the coefficients(a,b,c):")) delta=b...

2020-04-27 00:19:10 3250

转载 Transformer 在美团搜索排序中的实践

近年来,BERT等Transformer模型大放异彩,在搜索推荐系统应用也成为业界的一种潮流。美美今天介绍的这篇文章,将分享Transformer在美团搜索排序上的实践经验。引言美团搜索是美团 App 连接用户与商家的一种重要方式,而排序策略则是搜索链路的关键环节,对搜索展示效果起着至关重要的效果。目前,美团的搜索排序流程为多层排序,分别是粗排、精排、异构排序等,多层排序的流程主要是...

2020-04-24 17:50:12 1245

原创 剑指offer No.37 数字在排序数组中出现的次数

题目描述统计一个数字在排序数组中出现的次数。1、Javapublic class Solution { public int GetNumberOfK(int [] array , int k) { int len = array.length; int cnt=0; for(int i=0;i<len;i++){ ...

2020-04-22 21:28:26 624

原创 剑指offer No.31 整数中1出现的次数

题目描述求出1~13的整数中1出现的次数,并算出100~1300的整数中1出现的次数?为此他特别数了一下1~13中包含1的数字有1、10、11、12、13因此共出现6次,但是对于后面问题他就没辙了。ACMer希望你们帮帮他,并把问题更加普遍化,可以很快的求出任意非负整数区间中1出现的次数(从1 到 n 中1出现的次数)。1、Javapublic class Solution { ...

2020-04-20 21:18:07 708

转载 美团BERT的探索和实践

他山之石,可以攻玉。美团点评NLP团队一直紧跟业界前沿技术,开展了基于美团点评业务数据的预训练研究工作,训练了更适配美团点评业务场景的MT-BERT模型,通过微调将MT-BERT落地到多个业务场景中,并取得了不错的业务效果。背景2018年,自然语言处理(Natural Language Processing,NLP)领域最激动人心的进展莫过于预训练语言模型,包括基于RNN的ELMo[1]和...

2020-04-18 16:26:10 1905

原创 剑指offer No.29 最小的k个数

https://www.nowcoder.com/practice/6a296eb82cf844ca8539b57c23e6e9bf?tpId=13&tqId=11182&tPage=2&rp=2&ru=/ta/coding-interviews&qru=/ta/coding-interviews/question-ranking题目描述输入n个整数...

2020-04-17 22:20:00 727 1

原创 剑指offer No.27 字符串的排列

https://www.nowcoder.com/practice/fe6b651b66ae47d7acce78ffdd9a96c7?tpId=13&tqId=11180&tPage=2&rp=2&ru=%2Fta%2Fcoding-interviews&qru=%2Fta%2Fcoding-interviews%2Fquestion-ranking题目...

2020-04-17 20:29:58 898 2

原创 剑指offer No.28 数组中次数超过一半的数字

https://www.nowcoder.com/practice/947f6eb80d944a84850b0538bf0ec3a5?tpId=13&tqId=11179&tPage=2&rp=2&ru=%2Fta%2Fcoding-interviews&qru=%2Fta%2Fcoding-interviews%2Fquestion-ranking题目...

2020-04-17 20:27:34 673

原创 剑指offer No.25 复杂链表的复制

https://www.nowcoder.com/practice/f836b2c43afc4b35ad6adc41ec941dba?tpId=13&tqId=11178&tPage=2&rp=2&ru=/ta/coding-interviews&qru=/ta/coding-interviews/question-ranking题目描述输入一个复杂...

2020-04-17 20:23:55 651

原创 hive | 解决character '​' not supported here

今天在处理数据入库时出现了character '​' not supported here的bug经过问题排查,是在执行 load DATA LOCAL inpath 'XXX' overwrite into TABLE XXX partition(dt='20200417');中有不可见的字符导致的,将SQL复制到文本编辑器,将第30列后面的不可见字符删掉,问题就解决了...

2020-04-17 16:39:48 8946

原创 《墨菲定理》读书笔记 | 老鹰重生

一只刚练硬翅膀的小鹰兴奋地飞到了悬崖顶上,在那里,它看到了一个鹰巢。鹰巢前,有只已经很老的鹰正在费力地拔着自己的指甲,弄得两只爪子血淋淋的。“天哪,老鹰前辈,你这是怎么了?是受伤了吗?”小鹰急忙上前问道。老鹰停了下来:“没有,我在重生。”“重生?”小鹰的眼睛里闪过一丝迷惑。“是啊,孩子,你可能还不知道吧,在鸟类中,我们鹰可谓是长寿之王。据说,年龄最大的鹰前辈可以活到70岁。可是...

2020-04-15 12:57:20 1138

转载 爱奇艺多模态短视频内容标签技术及应用

自然语言处理(Natural Language Processing,NLP)是人工智能的一个重要分支,它研究能实现人与机器之间用自然语言进行有效通信的各种理论和方法,即让机器“懂”人类的语言。NLP 涉及的面非常广,包括语音识别 、内容理解、信息检索、信息抽取、问答系统、机器翻译、对话系统等。其中短视频的应用场景下,内容标签技术是内容理解的一个重要手段。本文主要给大家介绍多模态短视频内容标签技术...

2020-04-14 17:48:01 4208

原创 python菜鸟教程 | 文件读写及修改

文件的读写有三种形式:读、写和追加。一、读模式 r 和读写模式 r+1、读模式 r读模式r特点:(1)只能读,不能写;(2)文件不存在时会报错。(1)例:读取当前目录下的books.txt文件,该文件如下所示。 解析:a、用open打开文件,在python3中只有open。python2可以用open和file。关闭文件是close()。一般有开就有关b、如...

2020-04-14 14:54:12 1831

原创 Spark学习:Spark源码和调优简介 Spark Core (二)

本文基于 Spark 2.4.4 版本的源码,试图分析其 Core 模块的部分实现原理,其中如有错误,请指正。为了简化论述,将部分细节放到了源码中作为注释,因此正文中是主要内容。第一部分内容见:Spark学习:Spark源码和调优简介 Spark Core (一)Task 阶段下面是重头戏submitMissingTasks,这个方法负责生成 TaskSet,并且将它提交给 Tas...

2020-04-08 15:11:15 1756

转载 微信11亿用户基于时间序的海量存储扩展性与多机容灾能力提升

背景介绍业务场景作为以手机为主要平台的移动社交应用,微信内大部分业务生成的数据是有共性可言的:数据键值带有时间戳信息,并且单用户数据随着时间在不断的生成,我们将这类数据称为基于时间序的数据。例如朋友圈的发表,支付账单流水,公众号文章阅读记录等。这类基于时间序的数据通常不会删除,而是会随着时间流逝不断积累,相应需要的存储空间也与日俱增:key 量在万亿级别,数据量达到 PB 级别,每天新增 ...

2020-04-07 21:01:30 1073

原创 《所以,一切都是童年的错吗?》读书笔记

“新媒体排行榜”心理健康类第一公众号knowyourself首度结集,专业、犀利、直戳人心。原生家庭是如何影响我们的?个性背后是什么样的心理成因?恋爱关系中有怎样的心理机制?那些你在困惑时向自己提出的疑问,都可能在这本心理学科普书中,找到答案。直面真实,永远是改变的第一步。

2020-04-05 14:21:31 1325 6

原创 Spark学习:Spark源码和调优简介 Spark Core (一)

本文基于 Spark 2.4.4 版本的源码,试图分析其 Core 模块的部分实现原理,其中如有错误,请指正。为了简化论述,将部分细节放到了源码中作为注释,因此正文中是主要内容。Spark CoreRDDRDD(Resilient Distributed Dataset),即弹性数据集是 Spark 中的基础结构。RDD 是 distributive 的、immutable 的,可以被...

2020-04-04 17:37:45 778

原创 C++利器vector

文章目录1. vector:1.1 vector 说明1.2 vector初始化:1.3 vector对象的常用内置函数使用(举例说明)2. 顺序访问vector的几种方式,举例说明2.1. 对向量a添加元素的几种方式2.2 从向量中读取元素3.几个常用的算法1. vector:1.1 vector 说明vector是向量类型,可以容纳许多类型的数据,因此也被称为容器(可以...

2020-04-04 16:10:25 742 2

原创 回顾陆奇的传奇人生,下一站是“星辰和大海”

说来惭愧,直到陆奇在2017年加盟百度的时候,我才了解到这个技术领域的超级大佬,后面就一直关注他的动向。陆奇的每一次离职和任职都会成为中美互联网界的大新闻,在这之前我们先简单回顾一下陆奇的整个职场生涯。1求学之路1961年出生的陆奇,从小被寄养在上海爷爷家,爷爷家在江苏的一个小镇,屋里没有水、电,一年难得吃次肉,因环境及营养不良,使得陆奇体格孱弱并且视力不佳。陆奇...

2020-04-03 13:14:08 1220

原创 剑指offer No.18 二叉树的镜像

题目描述操作给定的二叉树,将其变换为源二叉树的镜像。

2020-04-01 11:48:58 754

原创 剑指offer No.14 链表中倒数第k个结点

题目描述输入一个链表,输出该链表中倒数第k个结点。1、借助于栈/*public class ListNode { int val; ListNode next = null; ListNode(int val) { this.val = val; }}*/import java.util.Stack;public class ...

2020-04-01 11:02:54 792

从贝叶斯公式看AI赋能人脑

從貝氏機率公式_看AI賦能人腦_ok2

2022-05-17

计算广告学第六单元课件.pdf

什么是广告? • 广告(Advertising)的定义 广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。 • 广告的主体 出资人(sponsor)即广告主(advertiser),媒介(medium),受众(audience) • 广告的本质功能 是借助某种有广泛受众的媒介的力量,完成较低成本的用户接触(reach)

2021-11-03

计算广告学第五单元课件.pdf

什么是广告? • 广告(Advertising)的定义 广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。 • 广告的主体 出资人(sponsor)即广告主(advertiser),媒介(medium),受众(audience) • 广告的本质功能 是借助某种有广泛受众的媒介的力量,完成较低成本的用户接触(reach)

2021-11-03

计算广告学第四单元课件.pdf

什么是广告? • 广告(Advertising)的定义 广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。 • 广告的主体 出资人(sponsor)即广告主(advertiser),媒介(medium),受众(audience) • 广告的本质功能 是借助某种有广泛受众的媒介的力量,完成较低成本的用户接触(reach)

2021-11-03

计算广告学第三单元课件.pdf

什么是广告? • 广告(Advertising)的定义 广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。 • 广告的主体 出资人(sponsor)即广告主(advertiser),媒介(medium),受众(audience) • 广告的本质功能 是借助某种有广泛受众的媒介的力量,完成较低成本的用户接触(reach)

2021-11-03

计算广告学第二单元课件.pdf

什么是广告? • 广告(Advertising)的定义 广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。 • 广告的主体 出资人(sponsor)即广告主(advertiser),媒介(medium),受众(audience) • 广告的本质功能 是借助某种有广泛受众的媒介的力量,完成较低成本的用户接触(reach)

2021-11-03

外卖广告机制的理论和实践.pdf

外卖广告机制的理论和实践.pdf

2021-10-31

深度学习在美团搜索广告排序的应用实践.pdf

在计算广告场景中,需要平衡和优化三个参与方——用户、广告主、平台的关 键指标,而预估点击率CTR(Click-through Rate)和转化率CVR (Conversion Rate)是其中非常重要的一环,准确地预估CTR和CVR对于提 高流量变现效率,提升广告主ROI(Return on Investment),保证用户体验 等都有重要的指导作用。 传统的CTR/CVR预估,典型的机器学习方法包括人工特征工程 + LR (Logistic Regression)[1]、GBDT(Gradient Boosting Decision Tree)[2] + LR、FM(Factorization Machine)[3]和FFM(Field-aware Factorization Machine)[4]等模型。相比于传统机器学习方法,深度学习模 型近几年在多领域多任务(图像识别、物体检测、翻译系统等)的突出表现, 印证了神经网络的强大表达能力,以及端到端模型有效的特征构造能力。同时 各种开源深度学习框架层出不穷,美团集团数据平台中心也迅速地搭建了GPU 计算平台,提供GPU集群,支持TensorFlow、MXNet、Caffe等框架,提供 数据预处理、模型训练、离线预测、模型部署等功能,为集团各部门的策略算 法迭代提供了强有力的支持。 美团海量的用户与商家数据,广告复杂的场景下众多的影响因素,为深度学习 方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景,介绍美 团搜索广告场景下深度学习的应用和探索。主要包括以下两大部分: · CTR/CVR预估由机器学习向深度学习迁移的模型探索 · CTR/CVR预估基于深度学习模型的线下训练/线上预估的工程优化

2021-10-31

知乎推荐算法和帐号运营2021.pdf

1.威尔逊算法对排名和推荐的影响,知乎的算法是为了优质内容获得更多 的曝光而服务的。 • 收藏 • 感谢 • 盐值 • 成为优秀回答者 • 成为付费会员 • 提升盐值 • 实名认证 2.新账号的运营准备工作

2021-09-16

Adaptive Focus for Efficient Video Recognition.pdf

本次研究工作为提高计算效率,作者对视频识别的空间冗余进行了探讨。发现在视频的每一帧中,信息量最大的区域通常是一个小的 image patch,在不同的帧中平稳地移动。因此,作者将 patch 定位问题建模为一个连续的决策任务,并提出一种基于强化学习的高效空间自适应视频识别方法:AdaFocus。并在 ActivityNet, FCVID, Mini-Kinetics, Something-Something V1&V2 5 个基准数据上进行了实验,得出比竞争性基线明显更有效率的结果。

2021-08-23

Linux教程.ppt

1.x Linux初步与环境安装。 2.x 常用命令介绍。 3.x vi/vim文本编辑器介绍。 4.x 用户管理。 5.x 进程管理。 6.x 系统文件构成。 7.x 软件包管理。 8.x Shell编程。

2021-08-20

NLP中的注意力机制.pptx

深度学习中的注意力可以广义地解释为重要性权重的向量:为了预测一个元素,例如句子中的单词,使用注意力向量来估计它与其他元素的相关程度有多强,并将其值的总和作为目标的近似值。

2021-08-14

神经网络语言模型.pdf

词向量模型应用 • 利用词向量的语言学特性完成任务 分布假说:语义相似的词,其词向量空间距离更相近 语义相关性、同义词检测、单词类比 • 将词向量作为特征,提高自然语言处理任务的性能 使用静态词向量,在模型训练过程中,只调整模型参数,不调整入词向量 基于平均词向量的文本分类、命名实体识别等 • 将词向量作为神经网络的初始值(动态词向量),提升神经网络模型的优化效果 使用动态词向量,模型训练过程中会调整词向量的初值 基于卷积神经网络的文本分类、词性标注

2021-08-14

深度学习与问答系统.pdf

在知识工程、互联网以及自然语言处理技术的推动下,问答系统 取得了一定进展 数据源:从限定领域向开放领域发展,从小规模向海量发展  提问类型:从受限类型向开放类型发展  参与者:领域专家到普通用户,门槛越来越低  知识贡献:从个人独享到大众知识分享

2021-08-14

深度学习与情感分析.pdf

情感分析是挖掘人们对物品、服务、组织、个人、事物、事件、话题及它们 属性的观点、情感、评价、态度和情绪等 对文本中蕴含的情感进行分析、处理、归纳和推理, 可以预测用户行为和做出应对策略。 互联网上蕴含着丰富的情感信息,其巨大价值引起了科技界、企业界 和各国政府的高度重视,诸多国家和国际组织已将情感分析研究提升 到国家和国际重大战略层面。

2021-08-14

当代大学生的就业与成才.doc

摘要:当今时代,经济全球化进程日益加快,科学技术发展迅猛异常,知识经济浪潮汹涌,给大学生的就业以及职业发展既带来了机遇,也提出了挑战。任何一名大学生在规划职业生涯时,都应考虑现实的外部条件。社会经济的发展,对人才素质的要求越来越高,给大学生的职业发展提出了新的要求。因此,大学生要勇于正视社会的机遇与挑战,正确认识、准确把握大学生就业形势,了解职业发展的趋势,树立正确的择业观,为选择并迈向正确的职业发展道路奠定牢固基础。 关键字:大学生择业观 个人生涯设计

2021-08-14

电信运营-计费管理系统的设计与实现.ppt

XX电信运营商新增一项Open Lab(开放实验室)出租业务,即该电信运营商提供基于Unix平台的实验室环境,选择使用这种业务的用户能够远程登录到实验室中做基于这个实验室环境的一些工作和实验。运营商希望借助先进的计算机技术对访问实验室的用户进行管理和计费,由此实现对此项业务运营的支持与管理。本项目主要包括以下子系统: 采集系统 整合系统 用户管理系统 资费管理系统 管理员管理系统 帐单查询系统 帐务查询系统 用户自服务系统 权限管理系统

2021-08-14

SQL Server数据库实验_存储过程与触发器设计.docx

实验5.1 存储过程的建立与使用 一、实验目的 理解存储过程的概念、作用、建立和调用方法。 二、实验原理 使用CREATE PROCEDURE语句创建存储过程,ALTER PROCEDURE语句修改存储过程,DROP PROCEDURE语句删除存储过程,存储过程有不带参数的、有带输入参数的、有带输出参数(output)的,还可以有带返回值的。创建好的存储过程可以使用EXEC procedure_name语句执行。 实验5.2 触发器的建立与使用 一、实验目的 理解触发器的概念和作用;了解触发器的分类及触发条件;掌握触发器的定义及应用。 二、实验原理 1、 使用CREATE TRIGGER语句定义触发器,ALTER TRIGGER语句修改触发器,DROP TRIGGER语句删除触发器。 2、 触发器分AFTER/FOR和INSTEAD OF两种类型:AFTER/FOR类型的触发器是在相应的触发语句(insert、delete、update)执行完后被触发的。如果触发语句对应的表上有完整性约束,这些完整性约束必须不违背时,相应的触发语句才能执行,然后才能触发对应的AFTER/FOR类型的触发器。INSTEAD OF类型的触发器会在触发语句(insert、delete、update)执行之前被触发,并取代相应的触发语句。 3、 在表或视图上,每个INSERT、UPDATE或DELETE语句只能创建一个INSTEAD OF类型的触发器,无法为有外键约束且指定为级联删除或级联修改的表创建DELETE或UPDATE语句上的INSTEAD OF 类型的触发器。 SQL SERVER为每个触发器都创建了两个临时表INSERTED表和DELETED表,这两个表的逻辑结构与被触发器作用的表一样,用户可以读取这两个表的内容,但不能对它们进行修改,触发器执行完后,这两个表也会自动删除。当执行INSERT时,INSERTED表中保存要向表中插入的所有行;当执行DELETE时,DELETED表中保存要从表中删除的所有行;当执行UPDATE时,修改前的行保存在DELETED表中,修改后的行保存在INSERTED行中。

2021-08-11

SQL Server数据库实验_创建和修改数据表及数据完整性.doc

实验2 创建和修改数据表及数据完整性 一、实验目的 熟悉有关数据表的创建和修改等工作,理解数据库模式的概念,了解主键约束、外键约束、UNIQUE约束和CHECK约束的创建和应用。要求学生熟练掌握使用企业管理器和T—SQL语句CREATE TABLE、ALTER TABLE及DROP TABLE语句对数据表进行管理。 二、实验原理 在企业管理器中实现表的创建和修改等工作及使用T—SQL语句CREATE TABLE、ALTER TABLE及DROP TABLE来实现数据表的创建、修改及删除。 三、实验设备 安装有SQL SERVER 2000的计算机。 四、实验内容 示例是某公司的产品销售数据库company,company数据库中存在人事表employee、客户表customer、销售表sales、销售明细表sale_item、产品表product。

2021-08-11

SQL Server数据库实验_数据查询与更新_简单的单表查询.doc

一、实验目的 熟练掌握用SELECT语句实现简单的单表查询。掌握SELECT子句、FROM子句、WHERE子句及ORDER BY 子句的用法。 二、实验原理 用SELECT语句实现简单的单表查询。在SELECT子句中用TOP关键字来限制返回到结果集中的记录数目,用DISTINCT关键字从结果集中去掉重复的记录。WHERE子句中用关系比较符、[NOT] BETWEEN、[NOT] IN、LIKE、 IS [NOT] NULL及逻辑运算符构成查询条件,对结果集中的记录进行筛选。ORDER BY子句将根据查询结果集中一个或多个字段对查询结果进行排序。 三、实验设备 安装有SQL SERVER 2000的计算机。 四、实验示例 1.查找表中所有姓刘的职工的工号,姓名,部门,薪水 2.查找所有定单金额高于20000的所有客户编号 3.查找业务部或会计部的女员工的基本信息。 4.选取编号界于‘C0001’和‘C0004’的客户编号、客户名称、客户地址。 5.选取销售数量最多的前5条订单订单号、数量。

2021-08-11

SQL Server数据库实验_数据查询与更新_复杂的单表查询.doc

一、实验目的 熟练掌握SELECT查询语句中的Group by 子句、Having子句的用法,以及汇总函数的使用。 二、实验原理 在查询语句中用Group by子句进行分组; 用Having子句对分组进行筛选。 使用MAX(),MIN(),COUNT(),SUM(),AVG()等函数在查询结果集中生成汇总值。 三、实验设备 安装有SQL SERVER 2000的计算机。

2021-08-11

数据仓库与数据挖掘第一章Part1 Introduction DW.ppt

数据仓库和数据挖掘技术是基于大规模数据库的决策支持系统环境的核心。

2021-08-07

数据仓库与数据挖掘第二章Part2 ETL_AND_OLAP.ppt

基于SQL SERVER的数据仓库架构,Microsoft SQL Server 2012 Integration Services (SSIS) 平台可以生成高性能数据集成解决方案,其中包括为数据仓库提取、转换和加载 (ETL) 包 Microsoft SQL Server提供两种ETL方式: 1、导入和导出数据 2、SQL Server Data Tools

2021-08-07

数据仓库与数据挖掘第三章Part3 An Intruction to Data Mining.ppt

数据库中的知识发现(Knowledge Discovery in Database,简称KDD)是一个从数据库中挖掘有效的、新颖的、潜在有用的和最终可理解的模式的复杂过程。 1)数据是一组事实的集合,它可以来自不同的数据源,可以是规则数据,也可以是非规则数据。 2)模式是关于数据子集的某种语言描述的表达式或某种可应用的模型,又称为知识。 3)模式必须是有效的、新颖的、潜在有用的和最终可理解的,分别用可信度、新颖度、可用度和简单度对其进行评价

2021-08-07

数据仓库与数据挖掘第五章Part5 Clustering聚类.ppt

聚类分析是将物理的或者抽象的数据集合划分为多个类别的过程,聚类之后每个类别中任意两个数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度。

2021-08-07

数据仓库与数据挖掘第六章Part6_6_SVM支持向量机.ppt

支持向量机(Support Vector Machine,简称SVM )是由贝尔实验室研究者Vapnik等于1995年首先提出的一种新的机器学习理论。 SVM主要思想是针对两类分类问题,在高维空间中寻找一个超平面作为两类的分割,以保证最小的分类错误率。 SVM一个重要的优点是可以处理线性不可分的情况,在解决小样本、非线性及高维(避免维灾难)模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 SVM独特的特点:使用训练集的一个子集来表示决策边界,该子集称作支持向量。

2021-08-07

数据仓库与数据挖掘第六章Part6_5_Rough_Set粗糙集.ppt

现实生活中有许多含糊现象并不能简单地用真、假值来表示﹐如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词,他把它归结到边界线上,也就是说在全域上存在一些个体既不能在其某个子集上分类,也不能在该子集的补集上分类。

2021-08-06

数据仓库与数据挖掘第六章Part6_4_Genetic_Algorithm遗传算法.ppt

遗传算法(Genetic Algorithms,GA)是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化搜索算法。它模拟了生物的繁殖、交配和变异现象,从初始的种群,产生一群更适应环境的后代。

2021-08-06

数据仓库与数据挖掘第六章Part6_3 Neural Network神经网络.ppt

人工神经网络(Artificial Neural Network,ANN)是对人类大脑系统特性的一种描述。简单地讲,它是一种数学模型,可以用电子线路来实现,用计算机程序来模拟,是人工智能的一种方法。神经网络通过对大量历史数据的计算来建立分类和预测模型。

2021-08-06

数据仓库与数据挖掘第六章Part6_2 Naive Bayes Bayesian networks朴素贝叶斯.ppt

贝叶斯分类是统计学方法。他们可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。贝叶斯分类主要是基于贝叶斯定理,通过计算给定样本属于一个特定类的概率来对给定样本进行分类。

2021-08-06

数据仓库与数据挖掘第六章Part6_1 Decision Tree决策树.ppt

决策树(decision tree)类似于流程图的树结构,由一个根节点,一组内部节点和一组叶节点组成。每个内部节点(包括根节点)表示在一个属性上的测试,每个分枝表示一个测试输出,每个叶节点表示一个类,有时不同的叶节点可以表示相同的类。

2021-08-06

数据仓库与数据挖掘第六章Part6_0 Classification.ppt

分类是数据挖掘的基本功能之一。 分类问题是一个普遍存在的问题,有许多不同的应用: 根据Email的标题和内容过滤垃圾邮件 根据核磁共振扫描的结果区分肿瘤是良性或恶性 信用分级、市场调查、图像模式识别… …

2021-08-06

HTMLCSSJavaScript标准教程:实例版(第2版)习题参考答案.docx

HTML/CSS/JavaScript标准教程:实例版(第2版)习题参考答案,为每章选择题,填空题的参考答案。

2021-08-03

互联网简历撰写技巧.zip

【1】简历撰写技巧指导 【2】应届生标准简历示范(技术类) 【3】技术类简洁版简历模板 【4】互联网风格简历模板 【5】通用简洁版简历模板 【6】英文简历模板

2021-08-02

map-reduce.pdf

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

2021-08-02

looklike.pdf

微信看一看的精选文章推荐大家应该都用过,微信团队在今年发表了一篇文章来专门介绍精选推荐的算法实现细节(Real-time Attention based Look-alike Model,简称RALM算法),这就是我们这篇文章要讲解的内容。基于这篇文章的描述,再结合自己的理解,我来带大家一起解读一下这篇基于look-alike模型的实时推荐算法的核心亮点。

2021-08-02

titanic.csv

机器学习泰坦尼克号数据集,Titanic - Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics

2021-06-11

主流app描述信息,包含package_name,app_name,app_info等基本信息

主流app描述信息,包含package_name,app_name,app_info等基本信息

2021-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除