自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xiongxiaoxuan的博客

你也进来看看吗

  • 博客(46)
  • 资源 (1)
  • 收藏
  • 关注

原创 深度学习思维导图整理(架构/模型/函数/应用领域)

PS:可以使用任何思维导图工具(如MindNode、XMind、MindMeister等)将上述内容转换为图形化的思维导图。这样可以更直观地展示深度学习相关的架构和模型。

2024-07-26 11:20:54 1281

原创 HiveSQL常见函数及使用方法(含代码示例)

HiveSQL(Hive SQL)是Apache Hive所使用的SQL方言,专门用于在Hadoop上进行大规模数据处理。

2024-07-26 10:42:18 634

原创 百度Ernie大模型是什么?

百度的Ernie模型(Enhanced Representation through kNowledge Integration)是一个基于Transformer架构的预训练语言模型。它由百度研发,旨在通过整合大规模语料和知识图谱来增强模型的语言理解和生成能力。它通过整合大规模语料和知识图谱,采用多任务学习和分层预训练策略,在多个自然语言处理任务上取得了显著的性能提升。Ernie模型的不断发展和优化,使其在语言理解和生成方面表现出色,广泛应用于各种实际场景中。

2024-07-26 10:27:42 1269

原创 Python练手小项目

编写一个猜数字游戏,计算机随机生成一个1到100之间的数字,用户需要猜这个数字,程序会提示猜大了还是猜小了,直到猜对为止。创建一个简单的待办事项列表应用,可以添加、查看和删除待办事项。创建一个简单的计算器,能够进行加、减、乘、除四种基本运算。创建一个简单的联系人管理系统,可以添加、查看、删除联系人。创建一个简单的记事本应用,用户可以添加、查看和删除笔记。

2024-07-25 21:29:30 5379 4

原创 ChatGPT的原理和成本

ChatGPT的大模型通过对这些语料库进行无监督学习,学到了自然语言的语法结构和语义表示,因此它能够高度准确和流畅地生成文本。同时,ChatGPT的大模型也可以根据用户输入的上下文信息,自动生成相关的响应文本,从而实现对话交互的功能。此外,ChatGPT也可以通过学习大量的开源代码库,习得代码的结构和语法规则,从而生成符合编程规范的代码。在这个操作系统上,人与AI之间的交互用的是人的语言,不再是冷冰冰的机器语言,或者高级机器语言,当然,在未来的十来年内,机器语言的使用率仍然会比较高,以便系统更迭和交互。

2024-07-25 21:20:29 2742 1

原创 Python小项目实战:杨辉三角

在 Python 中,列表是一种可变的序列类型,可以动态地增删元素。append 方法是列表对象的一个内置方法,用于在列表的末尾添加一个新的元素。row.append 是 Python 列表(list)对象的方法之一,用于在列表的末尾添加一个新的元素。编写python程序,实现输入正整数n,输出一个n层的杨辉三角,要求打印显示的时候左右对称。在生成杨辉三角的程序中,row.append 被用来在当前行(row)的末尾添加新的元素。下述代码可复制在vscode中运行。比如,输入7,返回结果如图所示。

2024-07-24 10:43:54 551

原创 GPT模型为什么能生成有意义的文本

GPT模型的真正能力是基于训练和大量语言数据的文本生成,其目标是创造性地生成文本,能够理解上下文,并生成与输入相关、通顺连贯的内容,而不是简单的联想输入。简言之,我们可以将GPT模型理解为一个会做文字接龙的模型:当我们给出一个不完整的句子,GPT会接上一个可能的词或字,就像我们在使用输入法时,我们输入上文,输入法会联想出下文一样。在经过基于大量数据的预训练和大量的计算之后,GPT模型表现出了令人惊艳的语言理解和生成能力,可以选择性地记住前文的重点,形成思维链推理能力。

2024-07-23 20:00:16 272

原创 Transformer和预训练模型是什么

GPT是一种语言模型,它是由OpenAI实验室于2018年推出的基于Transformer架构的预训练语言模型,通过处理大量的非标记语料来进行训练。GPT采用了单向的、基于自回归的方式来预测生成下一个单词的概率,也就是说,当输入前面的句子时,GPT可以预测下一个最有可能出现的单词是什么。GPT模型的主要组成部分是一个由多个层级堆叠而成的Transformer编码器,与其他基于Transformer的模型一样,它将输入序列转换为隐藏表示,再将其用于下游任务,如文本分类、命名实体识别等。那么GPT是什么呢?

2024-07-23 19:58:11 322

原创 AIGC高频产品面试题(二)

假设英文译为中文,英文单词数与中文字数之比为1∶1.6,在使用GPT-4的情况下,若输出1500个汉字,收0.06美元,约人民币0.432元,也就是约每千字0.36元。所以,两者的耗时比是40∶1。对于英文文本,1个token大约是4个字符或0.75个单词),GPT-4的使用费用为每1000个prompt token(用于文本生成的特定文本片段或单词)0.03美元或每1000个completion token(语言模型基于prompt token生成的完整文本)0.06美元。跨模态与多模态分别是什么?

2024-07-22 20:57:50 567

原创 AIGC小项目:情感分析

构建一个情感分析模型,该模型能够分析文本数据中的情感倾向,判断文本是积极的、消极的还是中性的。

2024-07-21 21:03:17 585

原创 SQL每日一题:员工奖金

编写解决方案,报告每个奖金 少于 1000 的员工的姓名和奖金数额。以 任意顺序 返回结果表。以employee表作为主表,和bonus表进行左连接,限制两个条件:bonus为空或小于1000。empId 是 Employee 表中 empId 的外键(reference 列)。该表的每一行都表示员工的姓名和 id,以及他们的工资和经理的 id。该表的每一行都包含一个员工的 id 和他们各自的奖金。empId 是该表中具有唯一值的列。empId 是该表具有唯一值的列。表:Employee。

2024-07-21 13:30:38 326

原创 SQL每日一题:订单最多的客户

查找下了 最多订单 的客户的 customer_number。测试用例生成后, 恰好有一个客户 比任何其他客户下了更多的订单。先按客户ID将“订单数”计算出来并分组,再按照订单数倒序排序,取第一条即可。在 SQL 中,Order_number是该表的主键。此表包含关于订单ID和客户ID的信息。查询结果格式如下所示。

2024-07-20 10:02:54 319

原创 SQL每日一题:寻找用户推荐人

简单的where查询,限制referee_id不等于2即可(条件1),要注意的是,需要添加补充条件2:referee_id为空时也返回name。因为条件1并不包含条件2,执行结果会报错。该表的每一行表示一个客户的 id、姓名以及推荐他们的客户的 id。找出那些 没有被 id = 2 的客户 推荐 的客户的姓名。以 任意顺序 返回结果表。在 SQL 中,id 是该表的主键列。表: Customer。

2024-07-20 09:51:47 399

原创 SQL每日一题:游戏玩法分析 I

每行数据记录了一名玩家在退出平台之前,当天使用同一台设备登录平台后打开的游戏的数目(可能是 0 个)。查询每位玩家 第一次登录平台的日期。在 SQL 中,表的主键是 (player_id, event_date)。用函数min()求得最小日期即可,按照player_id分组。这张表展示了一些游戏玩家在游戏平台上的行为活动。

2024-07-20 09:42:53 409

原创 AIGC高频产品面试题(专有名词科普及其在AI领域中的应用)

决策树通过一系列的决策节点和分支来表示不同的决策路径,最终实现对输入数据的分类或预测。在AIGC领域中,决策树常用于数据分类、特征选择、风险评估等任务。请举例说明强化学习在AIGC领域中的应用。它在AIGC领域中有什么应用?请举例说明它们在AIGC领域中的应用。它在AIGC领域中的重要性是什么?它在AIGC领域中有什么重要应用?它在AIGC领域中有什么独特应用?什么是递归神经网络(RNN)?它在AIGC领域中有什么应用?什么是自动驾驶技术?它在AIGC领域中的发展现状如何?请简述它在AIGC领域中的应用。

2024-07-18 18:40:05 767

原创 SQL每日一题:删除重复电子邮箱

运行脚本后,显示的答案是 Person 表。驱动程序将首先编译并运行您的代码片段,然后再显示 Person 表。Person 表的最终顺序 无关紧要。使用delete和where语句,通过将此表与自身在 Email 列上连接,然后找到具有相同电子邮件地址的其他记录中较大的 id。编写解决方案 删除 所有重复的电子邮件,只保留一个具有最小 id 的唯一电子邮件。(对于 Pandas 用户,请注意你应该直接修改 Person 表。该表的每一行包含一封电子邮件。id 是该表的主键列(具有唯一值的列)。

2024-07-18 15:51:33 596

原创 Python3基础语法和代码示例

【代码】Python3基础语法和代码示例。

2024-07-18 14:35:06 304

原创 新手学习AIGC的步骤与图谱

学习人工智能和生成式对话模型(Artificial Intelligence and Generative Conversational Models)是一项令人兴奋且具有挑战性的任务!

2024-07-17 16:15:53 588

原创 SQL每日一题:从不订购的客户

主表是customers表,有过购买记录的会出现在orders表,因此只需将两表进行左连接,筛选出orderid为null的顾客,即为从未购买过的顾客。customerId 是 Customers 表中 ID 的外键( Pandas 中的连接键)。找出所有从不点任何东西的顾客。以 任意顺序 返回结果表,结果格式如下所示。该表的每一行都表示订单的 ID 和订购该订单的客户的 ID。该表的每一行都表示客户的 ID 和名称。在 SQL 中,id 是该表的主键。在 SQL 中,id 是该表的主键。

2024-07-17 11:35:00 416

原创 SQL每日一题:查找重复的电子邮箱

编写解决方案来报告所有重复的电子邮件。请注意,可以保证电子邮件字段不为 NULL。以 任意顺序 返回结果表。按照email分组计数,筛选出数量>1的email。(需注意分组计数时一定要记得用group by)此表的每一行都包含一封电子邮件。电子邮件不包含大写字母。id 是该表的主键(具有唯一值的列)。

2024-07-17 11:07:39 554

原创 SQL每日一题:超过经理收入的员工

先把经理的信息放进临时表t1,包括ID、name、mana_salary,t1中的ID就是employee表中的manager ID,因此可以通过两个ID进行左连接,判断salary>mana_salary,即为薪资高于领导的员工。该表的每一行都表示雇员的ID、姓名、工资和经理的ID。编写解决方案,找出收入比经理高的员工。以任意顺序返回结果表。id 是该表的主键(具有唯一值的列)。

2024-07-16 20:31:42 383

原创 Python每日一题:回文数

回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。例如,121 是回文,而 123 不是。给你一个整数 x ,如果 x 是一个回文整数,返回 true;否则,返回 false。解释:从左向右读, 为 -121。从右向左读, 为 121-。因此它不是一个回文数。先将整数x转化为字符串形式,判断x和它的反转形态是否完全相等。解释:从右向左读, 为 01。需注意:True和False首字母大写!提示:-231

2024-07-16 19:26:54 452

原创 SQL每日一题:第二高的薪水

查询并返回 Employee 表中第二高的薪水。如果不存在第二高的薪水,查询应该返回 null(Pandas 则返回 None)。查询结果如下例所示。酷爱使用临时查询的小伙伴们需注意!若将第一段代码放入临时表,则case2会报错!因为临时表中没结果的时候是返回0行,而不是null。先通过排序和limit函数将第二名取出来,再判断若为空则返回null。在 SQL 中,id 是这个表的主键。表的每一行包含员工的工资信息。

2024-07-15 20:46:21 338

原创 SQL每日一题:组合两个表

编写解决方案,报告 Person 表中每个人的姓、名、城市和州。如果 personId 的地址不在 Address 表中,则报告为 null。以 任意顺序 返回结果表。该表的每一行都包含一个 ID = PersonId 的人的城市和州的信息。addressId 是该表的主键(具有唯一值的列)。personId 是该表的主键(具有唯一值的列)。| 列名 | 类型 |该表包含一些人的 ID 和他们的姓和名的信息。| 列名 | 类型 |表: Address。

2024-07-15 15:31:41 491

原创 Python每日一题:两数之和

定义三个变量:整数数组nums、整数target、输出整数数组list[],遍历nums中的全部数字,按nums[0]&nums[1]、nums[0]&nums[1]…nums[n-1]&nums[n] 顺序遍历,若nums[I]+nums[j]==target,则输出整数型数组[i,j]。解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1]。输入:nums = [2,7,11,15], target = 9。输入:nums = [3,2,4], target = 6。

2024-07-15 11:31:30 181

原创 AIGC各个应用场景下的模型选择

需要注意的是,下述模型可以在不同任务和领域中灵活应用,它们的归属也会根据模型的设计和主要应用领域而有所变化,并不绝对。

2024-07-11 21:21:06 1202 1

原创 字节数据PM面经分享(附内推码)

字节面经分享,欢迎来扰~

2022-06-14 17:29:29 620

原创 数据产品经理必备技能之埋点

一、埋点是什么1.1 埋点的含义主要描述用户在App内触发的一系列动作(比如:点击、侧滑等),事件采集主要通过应用内埋点来实现,因此也称为“埋点数据”。当页面加载和渲染完成之后,用户可以在页面上执行各类操作。通过采集用户的互动行为数据,以便通过量化获知用户的偏好或App优化点。1.2 埋点的意义埋点收集的用户相关数据,支持但不限于:产品方向:制作用户行为漏斗、指标等,优化产品功能设计、交互设计等。算法方向:支持推荐算法团队,合理分配流量,提高转化。开发侧:监控产品服务的稳定性,包含但不限于接

2022-03-06 00:12:27 1887

原创 常见的数据分析方法

分析方法学习分析方法的原因,主要针对以下几种症状没有数据分析意识统计式的数据分析知会使用工具的数据分析5W2H分析方法什么是5W2H分析方法?5W指:对于所有现象都追问5个问题,what(是什么)、when(何时)、where(何地)、why(为什么)、who(是谁)2H指:再追问2个问题,how(怎么做)、how much(多少钱)能解决哪些问题?如何设计一款产品what:这是什么产品when:何时需要上线where:在哪里发布这些产品why:用户为什么需要它who

2021-04-20 20:57:46 307

原创 产品经理日常数据分析工作

我们希望每一次的产品功能上新、功能改版,都可以带来更好的交互体验,项目所关注的指标能有大幅度的提升。但期望并不代表真实效果,功能上线后带来的真实效果还需要通过数据进行客观描述。在这篇文章中,我们将产品数据分析日常工作进行剖析,从数据采集到产品分析框架的梳理,进而介绍如何通过数据对产品及运营进行反哺。...

2020-12-16 18:27:39 350

原创 产品经理能力提升计划(高频面试问题)

名词解释请说一下以下几个名词代表的意思:广告展示,广告点击,广告转化率。广告展示:该广告在设定时间范围内的展示数量,也可以理解为曝光,广告在页面上曝光显示的次数,显示一次记为一个PV,被一个用户看到记为一个UV。广告点击:该广告在设定时间范围内的点击数量,广告被点击一次记为一个PV,被一个用户点击记为一个UV。广告转化率:=广告点击/广告展示*100%/具体取PV还是UV做除法,看实际应用时的衡量维度。请你来解释一下以下几个名词:ASO,UGC,SAAS,NFCASO:App Store

2020-12-15 14:28:57 832 1

原创 反作弊学习笔记(一)

互联网潜规则一:作弊与反作弊互联网作弊是什么?广告作弊与反作弊SEO反作弊——以百度为例电商反作弊——以淘宝为例互联网作弊是什么?互联网作弊是一种很普遍的行为,就拿我们最熟悉的来说,有电商和O2O的刷单刷信誉行为、广告作弊等,具体分类如下图:广告作弊与反作弊背景:互联网广告成为主流(1)数字营销(互联网广告)分两类:- 品牌广告:以品牌宣传为主,多以千次曝光的形式计费,广告主追求的是长期的品牌溢价;- 效果广告:多以单次点击或单次行为的形式计费,更关注短期转化和收益。(2)投放方式:C

2020-12-07 18:18:47 614 1

原创 商业产品学习笔记

如何理解商业产品经理商业PM需要与销售高效协作从宏观的角度讲,商业PM的广告策略应该与公司发展战略紧密结合,这就要求商业PM在提需求的时候应该充分了解公司的发展方向与节奏。此外,销售部门深入接触最前线客户,因此客户商业PM应该与前端销售紧密合作,及时掌握广告主的核心诉求,并制定对应的广告策略。商业PM应随时注意消除与销售的GAP,避免商业PM做出的需求没人用,广告主紧急的需求得不到响应。商业PM需要做项目的owner商业PM在团队中应该有owner的意识,需要对这个项目负责。商业PM要打通从后.

2020-12-07 12:03:13 219

原创 广告监测学习笔记(三)

移动广告反作弊作弊的手段归因劫持虚假流量产生的危害如何规避?1. SDK加密传输2. IP和设备黑白库3. 监测分包劫持4. 监测关联作弊5. 监测虚假包装6. 监测点击劫持7. 监测僵尸用户最后从作弊手段、产生危害和规避策略三方面进行阐释移动广告作弊是指广告主在移动应用推广过程当中,广告商或渠道商通过非法的技术手段,伪造或劫持目标推广应用的新增用户并从中获利的行为。这里的非法指的是在广告主不知情,不允许的情况下,任何单位或组织对广告投放活动的干扰物。随着移动互联网的发展,移动广告作弊的手段和

2020-12-04 10:00:27 508 1

原创 广告监测学习笔记(二)

广告监测学习笔记(2)概述渠道归因的核心:跟踪链接渠道归因的一些概念概述渠道归因有以下几种方式:设备号归因(精确匹配)渠道号归因(精准匹配)IP+UA归因(模糊匹配)其中设备号归因和IP+UA归因最重要的是生成一个可追踪的广告推广活动,进而和激活用户的信息进行比对。渠道归因的核心:跟踪链接跟踪链接是渠道活动归因的基础,没有跟踪链接什么用户信息都收集不了。一般第三方广告监测使用监控链接的目的有两个:第一,向应用(APP/H5/WEB)提供链接区分广告渠道;第二,划分用户以便进行用户分

2020-12-01 16:35:41 843 1

原创 广告监测学习笔记

广告监测学习笔记什么是广告监测为什么要对广告进行数据监测为什么要选择第三方广告监测公司广告监测涉及哪些参与者![在这里插入图片描述](https://img-blog.csdnimg.cn/20201130151443996.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTcwNDk3Mg==,size_16,color_FF

2020-11-30 17:31:29 723 1

原创 产品经理的逻辑思维培养(一)

互联网产品功能是怎样迭代的?用户分析从流程连贯性出发,满足用户的其他需求携程VS美团VS马蜂窝携程:火车票订购美团:酒店订购马蜂窝:门票订购问题:处在每一个流程节点时,可能会发生app之间的互相切换,表现出用户的损失或者对需求的不满足。目的:从流程角度去丰富产品的功能,用户的整个操作流程经过所有的节点都在自家的app上发生。解决:更早的介入需求流程更多的承接需求流程节点让用户整个流程节点所需要的服务,被自家产品一层一层的承接下来,而不会被流失到其他的平台上去。比如:WP.

2020-09-10 18:30:17 826 1

原创 Yummy产品说明文档1.0

分析目录项目概述修改记录需求列表个人信息入口搜索入口购物车入口订单入口动态页热门动态点赞按钮点餐页商品卡片加入购物车轮播图活动海报搜索页搜索框搜索结果加入购物车推荐商品筛选购物车页商品卡片门店入口商品管理按钮数量转换按钮清空失效宝贝按钮结算确认订单页结算商品卡片平台协议及政策入口提交订单按钮订单页已结算商品门店入口待付款页入口待评价页入口待取餐页入口待取餐页取餐信息预约提示订单信息复制按钮个人信息页个人信息卡片点我了解会员入口我的收藏记录我的用餐时刻我的钱包设置入口位置入口夜间按钮设置页账号管理手机号码隐私

2020-08-21 16:47:32 1084

原创 简书竞品分析

分析目录背景产品概述用户分析用户画像目标用户目标用户需求场景目标用户需求总结产品功能移动端产品功能结构产品流程图写作功能流程图投稿功能流程图产品交互首页推荐作者页面商业模式产品方向目前盈利模式未来可能盈利模式总结优点缺点&建议整体分析背景简书是什么?简书是国内最优质的创作社区。在这里,你可以随手记录自己的生活,与朋友们分享图片、文字或是图文并茂的文章。我们相信,每个人都是生活中的艺术家,有着无穷的创造力。作为国内首屈一指的活跃社区,每个人在创作的同时,都可以接受来自全世界的赞赏。简书的诞

2020-08-19 22:52:29 1749

原创 其他项目详情

豆瓣竞品分析python爬取商品信息并进行数据分析利用SPSS Modeler进行数据挖掘——探究不同程序语言的就业情况点餐软件原型设计

2020-08-04 19:54:54 308

Yummy美食.zip

Yummy美食点餐软件部分原型设计。利用原型设计软件mockplus进行界面设计与交互,以轻简风为主。

2020-07-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除