2021年01月_AI算法攻城狮

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Leetcode No.41 缺失的第一个正数

一、题目描述给你一个未排序的整数数组 nums ，请你找出其中没有出现的最小的正整数。进阶：你可以实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案吗？示例 1：输入：nums = [1,2,0]输出：3示例 2：输入：nums = [3,4,-1,1]输出：2示例 3：输入：nums = [7,8,9,11,12]输出：1提示：0 <= nums.length <= 300-2^31 <= nums[i] <= 2^31 - 1

2021-01-31 23:12:02 472 1

原创 Leetcode No.40 组合总和 II（DFS）

一、题目描述给定一个数组candidates和一个目标数target，找出candidates中所有可以使数字和为target的组合。candidates中的每个数字在每个组合中只能使用一次。说明：所有数字（包括目标数）都是正整数。解集不能包含重复的组合。示例1:输入: candidates =[10,1,2,7,6,1,5], target =8,所求解集为:[[1, 7],[1, 2, 5],[2, 6],[1, 1, 6]]...

2021-01-30 18:38:03 403

原创推荐系统中的排序学习框架

「排序学习（Learning to Rank，LTR）」，也称「机器排序学习（Machine-learned Ranking，MLR)」，就是使用机器学习的技术解决排序问题。自从机器学习的思想逐步渗透到信息检索等领域之后，如何利用机器学习来提升信息检索的性能水平变成了近些年来非常热门的研究话题，因此产生了各类基于机器学习的排序算法，也带来了搜索引擎技术的成熟和发展，如今，Learning to Rank已经成为搜索、推荐和广告领域非常重要的技术手段。本文我们首先介绍排序学习的三种主要类别，然后详细介绍

2021-01-28 14:54:30 458

原创网络广告中，CPC、CPA、CPM 的定义各是怎样的？

1.CPM（Cost Per Mille）：展现成本，或者叫千人展现成本这是衡量广告效果的一种基本形式（不管是传统媒体还是网络媒体）。为广告每展现给一千个人所需花费的成本。按CPM计费模式的广告，只看展现量，按展现量收费，不管点击、下载、注册什么的。一般情况下，网络广告中，视频贴片、门户banner等非常优质的广告位通常采用CPM收费模式。搜狐首页banner广告（也可能是按CPT收费模式）那么，广告主是如何知道广告展现了多少次了呢？在网络媒体广告中，一般由两种方法获得数据：一、是所投

2021-01-25 12:42:16 1307

原创过去50年最重要的统计学思想！

近日，图灵奖得主、“贝叶斯网络之父”Judea Pearl在Twitter上分享了一篇新论文“What are the most important statistical ideas of the past 50 years?”（过去50年中最重要的统计思想是什么？）这篇论文由哥伦比亚大学统计学教授Andrew Gelman和阿尔托大学计算机科学系副教授Aki Vehtari所著，他们根据自己的研究和文献阅读经验总结出了过去半个世纪以来最重要的8个统计思想，并表示：“它们是独立的概念，涵盖了统..

2021-01-24 18:53:38 532

原创 Leetcode No.39 组合总和（DFS）

一、题目描述给定一个无重复元素的数组candidates和一个目标数target，找出candidates中所有可以使数字和为target的组合。candidates中的数字可以无限制重复被选取。说明：所有数字（包括target）都是正整数。解集不能包含重复的组合。示例1：输入：candidates = [2,3,6,7], target = 7,所求解集为：[[7],[2,2,3]]示例2：输入：candidates = [2,3,5]...

2021-01-24 12:24:43 619 16

原创 Leetcode No.36 有效的数独

一、题目描述判断一个9x9 的数独是否有效。只需要根据以下规则，验证已经填入的数字是否有效即可。数字1-9在每一行只能出现一次。数字1-9在每一列只能出现一次。数字1-9在每一个以粗实线分隔的3x3宫内只能出现一次。上图是一个部分填充的有效的数独。数独部分空格内已填入了数字，空白格用'.'表示。示例1:输入:[["5","3",".",".","7",".",".",".","."],["6",".",".","1","9","5",".",...

2021-01-23 23:09:54 329

原创 Leetcode No.35 搜索插入位置（二分法）

一、题目描述给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。你可以假设数组中无重复元素。示例 1:输入: [1,3,5,6], 5输出: 2示例2:输入: [1,3,5,6], 2输出: 1示例 3:输入: [1,3,5,6], 7输出: 4示例 4:输入: [1,3,5,6], 0输出: 0二、解题思路遍历数组，当找到目标值时，返回其索引；假如当前元素小于目标值，且当前元素为最后一.

2021-01-19 21:58:29 377

原创 Leetcode No.34 在排序数组中查找元素的第一个和最后一个位置

一、题目描述给定一个按照升序排列的整数数组 nums，和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值 target，返回[-1, -1]。进阶：你可以设计并实现时间复杂度为O(log n)的算法解决此问题吗？示例 1：输入：nums = [5,7,7,8,8,10], target = 8输出：[3,4]示例2：输入：nums = [5,7,7,8,8,10], target = 6输出：[-1,-1]示例 3：输...

2021-01-19 00:04:56 587 6

原创 Leetcode No.33 搜索旋转排序数组（二分法）

一、题目描述升序排列的整数数组 nums 在预先未知的某个点上进行了旋转（例如， [0,1,2,4,5,6,7] 经旋转后可能变为[4,5,6,7,0,1,2] ）。请你在数组中搜索target ，如果数组中存在这个目标值，则返回它的索引，否则返回-1。示例 1：输入：nums = [4,5,6,7,0,1,2], target = 0输出：4示例2：输入：nums = [4,5,6,7,0,1,2], target = 3输出：-1示例 3：输入：nums = [1...

2021-01-17 23:52:57 1872 6

原创 Leetcode No.32 最长有效括号

一、题目描述给你一个只包含 '('和 ')'的字符串，找出最长有效（格式正确且连续）括号子串的长度。示例 1：输入：s = "(()"输出：2解释：最长有效括号子串是 "()"示例 2：输入：s = ")()())"输出：4解释：最长有效括号子串是 "()()"示例 3：输入：s = ""输出：0提示：0 <= s.length <= 3 * 104s[i] 为 '(' 或 ')'二、解题思路从左往右扫描，已扫描的左括号等待被匹配，用..

2021-01-17 01:56:12 421

原创 hive编程 | 引用jar包报class not found异常

场景：jar包上传到服务器，发现服务引用原因：jar包上传方式有问题，原来我使用send zmodelm解决方案：使用rz上传jar包

2021-01-13 12:00:25 1006

原创 hive 获取数组的最大值和最小值

1、首先把数组打散，生成中间表YYYselect exploded_column,XXXX.column2from XXXXLATERAL VIEW explode(XXXX.column1) t1 as exploded_column2、使用first_value获取最小值，last_value获取最大值select uid,point_id,first_value(loc_x)over(partition by uid order by point_id) as start,las

2021-01-11 21:28:34 5861

原创 Leetcode No.31 下一个排列

一、题目描述实现获取下一个排列的函数，算法需要将给定数字序列重新排列成字典序中下一个更大的排列。如果不存在下一个更大的排列，则将数字重新排列成最小的排列（即升序排列）。必须原地修改，只允许使用额外常数空间。示例 1：输入：nums = [1,2,3]输出：[1,3,2]示例 2：输入：nums = [3,2,1]输出：[1,2,3]示例 3：输入：nums = [1,1,5]输出：[1,5,1]示例 4：输入：nums = [1]输出：[1]

2021-01-11 13:56:56 335

原创 hive编程 | substr用法详解

使用语法: substr(string A, int start),substring(string A, int start) 两者用法一样,两个参数返回字符串A从start位置到结尾的字符串 hive> select substr('abcde',3);//意为从第三个开始截取，一直到结尾。a的下标为1。 cde hive> select substring('abcde',3); cde hive> se

2021-01-06 12:08:56 1555

原创 IMEI校验位算法Luhn

移动设备国际识别码(IMEI:International Mobile Equipment Identification Number)是区别移动设备的标志,具有唯一性,贴在手机背面的标志上,并且储存在移动设备中,可用于监控被窃或无效的移动设备,它也是该手机在厂家的"档案"和"身份证号".IMEI码由GSM(全球移动通信协会)统一分配,授权BABT(英国通信认证管理委员会)审受.其总长为15位,每位数字仅使用0～9的数字(含义见下文). IMEI由15位数字组成,其组成为:前6位...

2021-01-05 16:36:18 1276

原创 Leetcode No.30 串联所有单词的子串

给定一个字符串s和一些长度相同的单词words。找出 s 中恰好可以由words 中所有单词串联形成的子串的起始位置。注意子串要与words 中的单词完全匹配，中间不能有其他字符，但不需要考虑words中单词串联的顺序。示例 1：输入： s = "barfoothefoobarman", words = ["foo","bar"]输出：[0,9]解释：从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。输出的顺序不重要, [9,0] 也是...

2021-01-03 23:41:44 368

从贝叶斯公式看AI赋能人脑

從貝氏機率公式_看AI賦能人腦_ok2

2022-05-17

计算广告学第六单元课件.pdf

什么是广告？ • 广告(Advertising)的定义广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的，通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。 • 广告的主体出资人（sponsor）即广告主（advertiser），媒介（medium），受众（audience） • 广告的本质功能是借助某种有广泛受众的媒介的力量，完成较低成本的用户接触（reach）

2021-11-03

计算广告学第五单元课件.pdf

2021-11-03

计算广告学第四单元课件.pdf

2021-11-03

计算广告学第三单元课件.pdf

2021-11-03

计算广告学第二单元课件.pdf

2021-11-03

基于大数据的用户画像方法研究综述.pdf

在大数据时代，社交网络以及以社交为基础的互联网应用不断迅猛发展，其背后带来的是数据的爆炸式增长。对用户数据的采集以及合理的推荐，成为了各大网站的重要课题。用户画像提取过程，是个性化推荐的关键步骤。随着社交网络的快速发展，媒体类型不断丰富，用户参与门槛的不断降低。用户表达的数据模态逐渐呈现多样，为用户画像提取提供了广阔空间。随着用户画像数量的不断递增，利用大数据技术，有效的存储、计算用户画像，逐渐成为研究热点。本文首先介绍了相关的背景，然后介绍了基于大数据的用户画像构建方法，并介绍了不同数据集中的用户画像的应用，最后本文对基于大数据的用户画像方法进行了总结和展望，指明了该技术当前存在的问题与发展趋势。

2021-10-31

外卖广告机制的理论和实践.pdf

2021-10-31

深度学习在美团搜索广告排序的应用实践.pdf

在计算广告场景中，需要平衡和优化三个参与方——用户、广告主、平台的关键指标，而预估点击率CTR(Click-through Rate)和转化率CVR (Conversion Rate)是其中非常重要的一环，准确地预估CTR和CVR对于提高流量变现效率，提升广告主ROI(Return on Investment)，保证用户体验等都有重要的指导作用。传统的CTR/CVR预估，典型的机器学习方法包括人工特征工程 + LR (Logistic Regression)[1]、GBDT(Gradient Boosting Decision Tree)[2] + LR、FM(Factorization Machine)[3]和FFM(Field-aware Factorization Machine)[4]等模型。相比于传统机器学习方法，深度学习模型近几年在多领域多任务(图像识别、物体检测、翻译系统等)的突出表现，印证了神经网络的强大表达能力，以及端到端模型有效的特征构造能力。同时各种开源深度学习框架层出不穷，美团集团数据平台中心也迅速地搭建了GPU 计算平台，提供GPU集群，支持TensorFlow、MXNet、Caffe等框架，提供数据预处理、模型训练、离线预测、模型部署等功能，为集团各部门的策略算法迭代提供了强有力的支持。美团海量的用户与商家数据，广告复杂的场景下众多的影响因素，为深度学习方法的应用落地提供了丰富的场景。本文将结合广告特殊的业务场景，介绍美团搜索广告场景下深度学习的应用和探索。主要包括以下两大部分: · CTR/CVR预估由机器学习向深度学习迁移的模型探索 · CTR/CVR预估基于深度学习模型的线下训练/线上预估的工程优化

2021-10-31

知乎推荐算法和帐号运营2021.pdf

1.威尔逊算法对排名和推荐的影响，知乎的算法是为了优质内容获得更多的曝光而服务的。 • 收藏 • 感谢 • 盐值 • 成为优秀回答者 • 成为付费会员 • 提升盐值 • 实名认证 2.新账号的运营准备工作

2021-09-16

Adaptive Focus for Efficient Video Recognition.pdf

本次研究工作为提高计算效率，作者对视频识别的空间冗余进行了探讨。发现在视频的每一帧中，信息量最大的区域通常是一个小的 image patch，在不同的帧中平稳地移动。因此，作者将 patch 定位问题建模为一个连续的决策任务，并提出一种基于强化学习的高效空间自适应视频识别方法：AdaFocus。并在 ActivityNet, FCVID, Mini-Kinetics, Something-Something V1&V2 5 个基准数据上进行了实验，得出比竞争性基线明显更有效率的结果。

2021-08-23

Linux教程.ppt

1.x Linux初步与环境安装。 2.x 常用命令介绍。 3.x vi/vim文本编辑器介绍。 4.x 用户管理。 5.x 进程管理。 6.x 系统文件构成。 7.x 软件包管理。 8.x Shell编程。

2021-08-20

NLP中的注意力机制.pptx

深度学习中的注意力可以广义地解释为重要性权重的向量：为了预测一个元素，例如句子中的单词，使用注意力向量来估计它与其他元素的相关程度有多强，并将其值的总和作为目标的近似值。

2021-08-14

循环神经网络语言模型.pdf

循环神经网络（Recurrent Neural Network, RNN）是一类以序列（sequence）数据为输入，在序列的演进方向进行递归（recursion）且所有节点（循环单元）按链式连接的递归神经网络（recursive neural network） [1] 。对循环神经网络的研究始于二十世纪80-90年代，并在二十一世纪初发展为深度学习（deep learning）算法之一 [2] ，其中双向循环神经网络（Bidirectional RNN, Bi-RNN）和长短期记忆网络（Long Short-Term Memory networks，LSTM）是常见的循环神经网络 [3] 。循环神经网络具有记忆性、参数共享并且图灵完备（Turing completeness），因此在对序列的非线性特征进行学习时具有一定优势 [4] 。循环神经网络在自然语言处理（Natural Language Processing, NLP），例如语音识别、语言建模、机器翻译等领域有应用，也被用于各类时间序列预报。引入了卷积神经网络（Convolutional Neural Network,CNN）构筑的循环神经网络可以处理包含序列输入的计算机视觉问题。

2021-08-14

神经网络语言模型.pdf

词向量模型应用 • 利用词向量的语言学特性完成任务分布假说:语义相似的词，其词向量空间距离更相近语义相关性、同义词检测、单词类比 • 将词向量作为特征，提高自然语言处理任务的性能使用静态词向量，在模型训练过程中，只调整模型参数，不调整入词向量基于平均词向量的文本分类、命名实体识别等 • 将词向量作为神经网络的初始值(动态词向量)，提升神经网络模型的优化效果使用动态词向量，模型训练过程中会调整词向量的初值基于卷积神经网络的文本分类、词性标注

2021-08-14

深度学习与问答系统.pdf

在知识工程、互联网以及自然语言处理技术的推动下，问答系统取得了一定进展数据源:从限定领域向开放领域发展，从小规模向海量发展  提问类型:从受限类型向开放类型发展  参与者:领域专家到普通用户，门槛越来越低  知识贡献:从个人独享到大众知识分享

2021-08-14

深度学习与情感分析.pdf

情感分析是挖掘人们对物品、服务、组织、个人、事物、事件、话题及它们属性的观点、情感、评价、态度和情绪等对文本中蕴含的情感进行分析、处理、归纳和推理，可以预测用户行为和做出应对策略。互联网上蕴含着丰富的情感信息，其巨大价值引起了科技界、企业界和各国政府的高度重视，诸多国家和国际组织已将情感分析研究提升到国家和国际重大战略层面。

2021-08-14

当代大学生的就业与成才.doc

摘要：当今时代，经济全球化进程日益加快，科学技术发展迅猛异常，知识经济浪潮汹涌，给大学生的就业以及职业发展既带来了机遇，也提出了挑战。任何一名大学生在规划职业生涯时，都应考虑现实的外部条件。社会经济的发展，对人才素质的要求越来越高，给大学生的职业发展提出了新的要求。因此，大学生要勇于正视社会的机遇与挑战，正确认识、准确把握大学生就业形势，了解职业发展的趋势，树立正确的择业观，为选择并迈向正确的职业发展道路奠定牢固基础。关键字：大学生择业观个人生涯设计

2021-08-14

电信运营-计费管理系统的设计与实现.ppt

XX电信运营商新增一项Open Lab（开放实验室）出租业务，即该电信运营商提供基于Unix平台的实验室环境，选择使用这种业务的用户能够远程登录到实验室中做基于这个实验室环境的一些工作和实验。运营商希望借助先进的计算机技术对访问实验室的用户进行管理和计费，由此实现对此项业务运营的支持与管理。本项目主要包括以下子系统：采集系统整合系统用户管理系统资费管理系统管理员管理系统帐单查询系统帐务查询系统用户自服务系统权限管理系统

2021-08-14

SQL Server数据库实验_存储过程与触发器设计.docx

实验5.1 存储过程的建立与使用一、实验目的理解存储过程的概念、作用、建立和调用方法。二、实验原理使用CREATE PROCEDURE语句创建存储过程，ALTER PROCEDURE语句修改存储过程，DROP PROCEDURE语句删除存储过程，存储过程有不带参数的、有带输入参数的、有带输出参数(output)的，还可以有带返回值的。创建好的存储过程可以使用EXEC procedure_name语句执行。实验5.2 触发器的建立与使用一、实验目的理解触发器的概念和作用；了解触发器的分类及触发条件；掌握触发器的定义及应用。二、实验原理 1、使用CREATE TRIGGER语句定义触发器，ALTER TRIGGER语句修改触发器，DROP TRIGGER语句删除触发器。 2、触发器分AFTER/FOR和INSTEAD OF两种类型：AFTER/FOR类型的触发器是在相应的触发语句（insert、delete、update）执行完后被触发的。如果触发语句对应的表上有完整性约束，这些完整性约束必须不违背时，相应的触发语句才能执行，然后才能触发对应的AFTER/FOR类型的触发器。INSTEAD OF类型的触发器会在触发语句（insert、delete、update）执行之前被触发，并取代相应的触发语句。 3、在表或视图上，每个INSERT、UPDATE或DELETE语句只能创建一个INSTEAD OF类型的触发器，无法为有外键约束且指定为级联删除或级联修改的表创建DELETE或UPDATE语句上的INSTEAD OF 类型的触发器。 SQL SERVER为每个触发器都创建了两个临时表INSERTED表和DELETED表，这两个表的逻辑结构与被触发器作用的表一样，用户可以读取这两个表的内容，但不能对它们进行修改，触发器执行完后，这两个表也会自动删除。当执行INSERT时，INSERTED表中保存要向表中插入的所有行；当执行DELETE时，DELETED表中保存要从表中删除的所有行；当执行UPDATE时，修改前的行保存在DELETED表中，修改后的行保存在INSERTED行中。

2021-08-11

SQL Server数据库实验_创建和修改数据表及数据完整性.doc

实验2 创建和修改数据表及数据完整性一、实验目的熟悉有关数据表的创建和修改等工作，理解数据库模式的概念，了解主键约束、外键约束、UNIQUE约束和CHECK约束的创建和应用。要求学生熟练掌握使用企业管理器和T—SQL语句CREATE TABLE、ALTER TABLE及DROP TABLE语句对数据表进行管理。二、实验原理在企业管理器中实现表的创建和修改等工作及使用T—SQL语句CREATE TABLE、ALTER TABLE及DROP TABLE来实现数据表的创建、修改及删除。三、实验设备安装有SQL SERVER 2000的计算机。四、实验内容示例是某公司的产品销售数据库company，company数据库中存在人事表employee、客户表customer、销售表sales、销售明细表sale_item、产品表product。

2021-08-11

SQL Server数据库实验_数据查询与更新_简单的单表查询.doc

一、实验目的熟练掌握用SELECT语句实现简单的单表查询。掌握SELECT子句、FROM子句、WHERE子句及ORDER BY 子句的用法。二、实验原理用SELECT语句实现简单的单表查询。在SELECT子句中用TOP关键字来限制返回到结果集中的记录数目，用DISTINCT关键字从结果集中去掉重复的记录。WHERE子句中用关系比较符、[NOT] BETWEEN、[NOT] IN、LIKE、 IS [NOT]　NULL及逻辑运算符构成查询条件，对结果集中的记录进行筛选。ORDER BY子句将根据查询结果集中一个或多个字段对查询结果进行排序。三、实验设备安装有SQL SERVER 2000的计算机。四、实验示例 1．查找表中所有姓刘的职工的工号，姓名，部门，薪水 2．查找所有定单金额高于20000的所有客户编号 3．查找业务部或会计部的女员工的基本信息。 4．选取编号界于‘C0001’和‘C0004’的客户编号、客户名称、客户地址。 5．选取销售数量最多的前5条订单订单号、数量。

2021-08-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

从贝叶斯公式看AI赋能人脑

计算广告学第六单元课件.pdf

计算广告学第五单元课件.pdf

计算广告学第四单元课件.pdf

计算广告学第三单元课件.pdf

计算广告学第二单元课件.pdf

基于大数据的用户画像方法研究综述.pdf

外卖广告机制的理论和实践.pdf

深度学习在美团搜索广告排序的应用实践.pdf

知乎推荐算法和帐号运营2021.pdf

Adaptive Focus for Efficient Video Recognition.pdf

Linux教程.ppt

NLP中的注意力机制.pptx

循环神经网络语言模型.pdf

神经网络语言模型.pdf

深度学习与问答系统.pdf

深度学习与情感分析.pdf

当代大学生的就业与成才.doc

电信运营-计费管理系统的设计与实现.ppt

SQL Server数据库实验_存储过程与触发器设计.docx

SQL Server数据库实验_创建和修改数据表及数据完整性.doc

SQL Server数据库实验_数据查询与更新_简单的单表查询.doc

SQL Server数据库实验_数据查询与更新_复杂的单表查询.doc

数据仓库与数据挖掘第一章Part1 Introduction DW.ppt

数据仓库与数据挖掘第二章Part2 ETL_AND_OLAP.ppt

数据仓库与数据挖掘第三章Part3 An Intruction to Data Mining.ppt

数据仓库与数据挖掘第五章Part5 Clustering聚类.ppt

数据仓库与数据挖掘第六章Part6_6_SVM支持向量机.ppt

数据仓库与数据挖掘第六章Part6_5_Rough_Set粗糙集.ppt

数据仓库与数据挖掘第六章Part6_4_Genetic_Algorithm遗传算法.ppt

数据仓库与数据挖掘第六章Part6_3 Neural Network神经网络.ppt

数据仓库与数据挖掘第六章Part6_2 Naive Bayes Bayesian networks朴素贝叶斯.ppt

数据仓库与数据挖掘第六章Part6_1 Decision Tree决策树.ppt

数据仓库与数据挖掘第六章Part6_0 Classification.ppt

HTMLCSSJavaScript标准教程：实例版（第2版）习题参考答案.docx

互联网简历撰写技巧.zip

map-reduce.pdf

looklike.pdf

titanic.csv

主流app描述信息，包含package_name,app_name,app_info等基本信息

空空如也