自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 收藏
  • 关注

原创 AI大战:通用VS垂直模型,谁主未来?

在这个多元化的AI时代,理解每种模型的优势和局限,将帮助我们更好地利用人工智能的力量,推动社会的发展和进步。此外,通用大模型虽然覆盖面广,但在特定领域的深度和精准度上可能不及专门训练的垂直大模型。在未来的发展中,AI大模型的竞争已经超越了单纯的技术层面,更多地体现在生态的构建上。但是,垂直大模型的开发和维护成本较高,因为它们需要大量特定领域的数据和专业知识。在人工智能的世界里,大模型的战场正逐渐分化为两个阵营:通用大模型和垂直大模型。通用大模型和垂直大模型各有千秋,它们在不同的应用场景下有着不同的表现。

2024-06-17 14:54:20 327

原创 AIGC新秀亮相,哪款大模型产品最得你心?

这些所谓的“全能”大模型产品,凭借其强大的生成能力和广泛的应用场景,正逐渐改变我们的工作和生活方式。其次,跨界融合创新将成为一种趋势,比如与虚拟现实、增强现实技术的结合,为用户带来全新的体验。选择这样的产品,主要是因为它们能够更好地适应不同场景下的需求,从而提升工作和生活的效率。首先,技术将持续进步,使得这些产品能够处理更复杂的任务,生成更高质量和多样化的内容。再者,随着大数据和机器学习技术的深入应用,这些产品将能更精准地满足用户个性化的需求。在众多全能大模型AIGC产品中,我有幸体验了其中的一些。

2024-06-17 14:50:35 496

原创 计算机专业:万金油还是夕阳产业?

🏫 顶尖大学的计算机专业通常提供更为丰富的资源,但二流的院校也有很多优秀的计算机专业,关键在于它们能否提供实践机会和良好的学术环境。对于选择了计算机专业的学生来说,他们在大学期间不仅要学习专业知识,还要积极参加实习、项目开发和竞赛,以提升自己的实践经验。在过去的一段时间里,计算机科学与技术、人工智能、网络安全、软件工程等专业一直都是热门的存在,吸引了大批的学生。在高校的选择上,学生们应该关注计算机专业的排名,选择那些有良好教学质量和就业支持的学校。个人的兴趣和能力也是选择专业的重要依据。

2024-06-17 14:46:37 216

原创 AI大模型争霸:通用vs垂直,谁主沉浮?

通用大模型如MiniMax-abab和言犀基础大模型覆盖了从自然语言处理到图像识别再到语音识别的广阔领域,这种模型因其庞大的参数规模和综合的数据训练能力,能够应对复杂多变的任务需求。比如,在知识问答、娱乐内容生成等领域,这些大型模型已经表现出令人瞩目的成效,它们的普遍适用性和灵活的迁移学习能力使得开发成本得以降低,快速适应新任务成为可能。与此同时,垂直大模型则专注于深入特定行业,例如蚂蚁百灵大模型在金融领域的应用,以及各类针对医疗、教育等行业定制的模型。在这样的背景下,选择适合的大模型变得尤为重要。

2024-06-17 14:43:45 350

原创 高考后选择难?专业与学校,哪个更重要?

在这个过程中,我们可以通过网络平台、社交媒体、教育机构等渠道获取更多的信息,也可以咨询一些专业的人士或者联系目标大学的在校生或毕业生,了解他们对于大学和专业的评价和感受。你可以根据自己的兴趣和能力,选择与之匹配的专业,这样在未来的学习和工作中才能保持积极性和动力,发挥潜力和创造价值。而对于学校的选择,如果你还没有明确的职业选择,或者你的分数相对较低,那么学校优先的原则可能更适合你。根据自己的高考成绩和所在省份的志愿填报规则,合理安排志愿的顺序和数量,做出最优的选择。只有这样,我们才能做出最适合自己的选择。

2024-06-17 14:40:37 506

原创 SparkStreaming编程-DStream输出

【代码】SparkStreaming编程-DStream输出。

2024-06-04 10:00:00 389

原创 SparkStreaming编程-DStream转换

【代码】SparkStreaming编程-DStream转换。

2024-06-04 09:00:00 545

原创 SparkStreaming编程-DStream创建

其实就是自定义接收器需要继承Receiver,并实现onStart、onStop方法来自定义数据源采集。

2024-06-03 11:15:49 257 1

原创 SparkStreaming概述

【代码】SparkStreaming概述。

2024-06-03 10:12:11 278

原创 SparkSQL编程-RDD、DataFrame、DataSet

spark三种形态的相互转换

2024-05-31 10:30:00 337

原创 SparkSQL编程-DataSet

【代码】SparkSQL编程-DataSet。

2024-05-31 08:30:00 449

原创 SparkSQL编程-DataFrame

【代码】SparkSQL编程-DataFrame。

2024-05-30 10:56:18 808

原创 SparkSQL概述

Spark SQL 是 Spark 用于结构化数据(structured data) 处理的 Spark 模块.与基本的 Spark RDD API 不同, Spark SQL 的抽象数据类型为 Spark 提供了关于数据结构和正在执行的计算的更多信息.在内部, Spark SQL 使用这些额外的信息去做一些额外的优化.有多种方式与 Spark SQL 进行交互, 比如: SQL 和 Dataset API. 当计算结果的时候, 使用的是相同的执行引擎, 不依赖你正在使用哪种 API 或者语言.

2024-05-30 10:08:06 255

原创 Spark的序列化

【代码】Spark的序列化。

2024-05-28 09:41:37 516

原创 Spark的共享变量

【代码】Spark的共享变量。

2024-05-28 09:35:25 516

原创 RDD的缓存

【代码】RDD的缓存。

2024-05-27 10:21:20 192

原创 RDD的操作算子

【代码】RDD的操作算子。

2024-05-27 10:07:17 314

原创 RDD介绍

【代码】RDD介绍。

2024-05-24 10:48:20 359

原创 Spark介绍

【代码】Spark介绍。

2024-05-24 10:32:10 340

原创 AI模型发展:开源VS闭源,你挺谁?

一个典型的例子就是TensorFlow、PyTorch这样的深度学习框架,它们的开源性质让全世界的研究者和开发者都能贡献自己的力量,推动了深度学习技术的快速发展。然而,开源也有其不足之处。但是,闭源的缺点也很明显,由于缺乏外部的贡献,产品的发展速度可能不如开源项目快,且一旦公司内部开发受阻,可能较难得到外界的帮助。不过,随着技术的发展和社会需求的变化,未来AI模型的发展路径可能会出现新的变革和趋势,我们需要持续关注并做出适时的调整。随着AI技术的不断成熟,社会对于AI的透明度和公平性的要求也在提高。

2024-05-23 10:33:04 271

原创 Hive实现delete、update操作

【代码】Hive实现delete、update操作。

2024-05-23 09:18:37 769

原创 Hive的limit、offset

【代码】Hive的limit、offset。

2024-05-23 09:06:43 187

原创 Hive的脱敏函数

【代码】Hive的脱敏函数。

2024-05-22 09:54:58 278

原创 多措并举,让大模型更聪明

持续收集和整合更多高质量、多样化的数据,并通过合适的数据增强技术来扩充数据量和丰富数据特征,这有助于模型学习到更全面的知识和模式。:不断探索和研发更先进、更高效的模型架构,使其能够更好地处理和理解复杂的信息,提高模型的表达能力。:结合多种模态的数据,如文本、图像、音频等,让模型能够从多个角度理解和分析事物,提升综合智能水平。:通过迁移已有的知识和经验到新的领域或任务中,同时支持模型不断学习新的内容,保持与时俱进。:利用强化学习算法,让模型在与环境的交互中不断学习和改进策略,以适应不同的任务和场景。

2024-05-22 09:00:00 176

原创 Hive的MSCK命令

Hive的MSCK命令。

2024-05-21 09:32:42 274

原创 Hive的小文件处理

Hive的小文件处理。

2024-05-21 09:20:16 785

原创 Hive的UDF函数

Hive的UDF函数

2024-05-20 17:09:02 352

原创 Hive的不等值连接

【代码】Hive的不等值连接。

2024-05-20 09:31:24 183

原创 Hive的保留关键字

Hive的保留关键字。

2024-05-20 09:27:13 281

原创 拒绝焦虑,开启开挂人生

其实,它是一种自然的生存机制,帮助我们应对危险和挑战。💪 然而,当它超过了一定的程度,就会对我们的身心健康造成严重的影响。1️⃣保持积极的生活习惯:比如定期运动、保持良好的饮食习惯、充足的睡眠等。每天起床,你会感到一种深深的焦虑感,仿佛有一块巨石压在你的胸口。记住,无论生活中遇到什么困难和挑战,都要勇敢地面对它们,因为你比你想象的要强大得多。3️⃣寻求专业的帮助:如果你发现自己的焦虑感无法自我控制,那么寻求专业的心理咨询是非常重要的。你是独一无二的,你就是你。我亲爱的朋友们,你们有没有过这样的经历呢?

2024-05-19 11:30:00 102

原创 AIGC行业揭秘:现在入局,机会还是陷阱?

此外,个性化内容的消费需求也推动了AIGC的发展,因为它能快速生成符合个人偏好的内容。另外,随着技术的普及,竞争也在加剧,这就要求新进入者必须具备强大的技术实力和创新能力。值得一提的是,AIGC行业的发展不仅可能改变我们消费内容的方式,还有可能重塑内容创造者的行业格局。因此,无论你是内容创作者、技术开发者还是创业者,关注AIGC行业的最新动态,理解其背后的技术和市场需求,都将对你的未来发展方向产生重要影响。AIGC行业是一个充满潜力的新兴领域,对于有准备的人来说,它提供了无限的可能性。

2024-05-19 09:30:00 270

原创 AI技术揭秘:内容生产效率质量翻倍提升

AI技术还可以通过对用户行为数据的分析,提供精准的用户画像,帮助内容生产者更好地理解用户需求,从而提高内容的针对性和吸引力。例如,AI可以通过分析用户的浏览历史、搜索记录等数据,推测出用户的兴趣和需求,然后根据这些信息,生成更符合用户口味的内容。例如,AI可以通过算法自动筛选和整理信息,生成初步的内容框架,然后由人工进行微调和优化,大大提高了内容生产的效率。在未来,随着AI技术的不断发展和完善,我们有理由相信,它将在内容生产领域发挥更大的作用,为我们带来更多的惊喜和价值。

2024-05-18 11:30:00 260

原创 未来已来!IT行业的重塑之路

无论是亚马逊的AWS、微软的Azure还是谷歌的Google Cloud Platform,都在不断地扩展自己的版图,提供更为全面和个性化的服务。从个人电脑的普及到互联网信息的爆炸,从智能手机的革命到云计算、大数据以及人工智能的飞速发展,每一次技术的突破和创新,都深刻地改变了我们的生活和工作方式。一方面,技术的进步为我们带来了前所未有的便捷,物联网、智能家居、远程办公等将逐渐成为日常生活的常态。另一方面,随着技术的深入,网络安全问题、数据隐私保护等也日益突出,这需要行业内外的专家共同努力去解决。

2024-05-18 09:00:00 174

原创 Hive的字符串操作

【代码】Hive的字符串操作。

2024-05-17 10:40:23 370

原创 Hive的json解析

【代码】Hive的json解析。

2024-05-17 09:34:21 312

原创 Hive的行列转换

【代码】Hive的行列转换。

2024-05-16 09:52:55 603

原创 Hive的窗口函数

【代码】Hive的窗口函数。

2024-05-16 09:34:19 423

原创 Hive的“分区”

【代码】Hive的“分区”

2024-05-15 13:51:31 492

原创 Hive的排序

• 使用 ASC[ascdend] 或 DESC[descend] 关键字来设置查询结果是按升序或降序排列,默认按升序 ASC 排列.• order by 后可跟多个字段,字段之间用英文逗号隔开,多个字段时,优先级按先后顺序而定.• 若A、B都升序: order by A,B;若A、B都用降序,必须用两个DESC: order by A DESC,B DESC;• 若A用升序,B用降序,SQL该这样写: order by A ASC,B DESC;

2024-05-15 13:37:18 262

原创 Hive的group by

【代码】Hive的group by。

2024-05-14 09:07:11 337

ClickHouse文档.docx

一、clickhouse简介 ClickHouse 是俄罗斯的 Yandex 于 2016 年开源的用于在线分析处理查询(OLAP :Online Analytical Processing)MPP架构的列式存储数据库(DBMS:Database Management System),能够使用 SQL 查询实时生成分析数据报告。ClickHouse的全称是Click Stream,Data WareHouse。 clickhouse可以做用户行为分析,流批一体 线性扩展和可靠性保障能够原生支持 shard + replication clickhouse没有走hadoop生态,采用 Local attached storage 作为存储 二、clickhouse特点 1、列式存储: 行式存储的好处: 想查找某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以;但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。 列式存储的好处 对于列的聚合、计数、求和等统计操作优于行式存储 由于某一列的数据类型都是相同的,针对于数据存储更容易

2024-05-08

哈希表学习笔记.docx

哈希表是构造出来的一种可以快速查找的存储结构。 哈希存储的基本思想是以关键字为自变量,通过一定的函数关系(称为散列函数或者哈希函数),计算出对应的函数值,以这个值作为数据元素的地址,将该数据元素存到相应的地址单元中去。 查找时,再根据关键字采用计算哈希值的方式计算出相应的哈希地址,再到相应的存储单元去取需要的元素即可。 本文档目录如下: 一.什么哈希表 二.什么是哈希冲突 三.如何减少哈希冲突 四.处理冲突的方法 五.负载因子 六.HashCode转为合法下标 七.哈希表的实现 1.成员变量 2.成员方法 (2).get()方法 (3).remove()方法 八.实现哈希表全代码

2024-05-08

阿里云大数据工程师ACP认证培训课程.pdf

阿里云大数据ACP认证考试是面向大数据分析师、BI工程师的专业技能认证,涵盖数据分析相关的知识体系,如大数据基础知识、大数据存储技术、数据分析工具、数据可视化、数据编程、数据质量控制、数据分析项目管理、机器学习等。 本认证仅支持持有中国大陆身份证用户参与,同一账号同一认证有效期内仅可领取一次证书。 试卷满分为100分,考试时间为120分钟 及格分数:80 答题方式:闭卷 ACP考试不支持子账号和公司账号,请勿使用子账号和公司账号报名。自2021年11月1日起,阿里认证考场将陆续切换至普尔文考试中心,具体请参考 报名指南。

2024-05-08

阿里云认证普尔文考场预约指引v1.5.pdf

阿里云大数据ACP认证考试是面向大数据分析师、BI工程师的专业技能认证,涵盖数据分析相关的知识体系,如大数据基础知识、大数据存储技术、数据分析工具、数据可视化、数据编程、数据质量控制、数据分析项目管理、机器学习等。 本认证仅支持持有中国大陆身份证用户参与,同一账号同一认证有效期内仅可领取一次证书。 试卷满分为100分,考试时间为120分钟 及格分数:80 答题方式:闭卷 ACP考试不支持子账号和公司账号,请勿使用子账号和公司账号报名。自2021年11月1日起,阿里认证考场将陆续切换至普尔文考试中心,具体请参考 报名指南。

2024-05-08

apache-phoenix-4.14.2-HBase-1.3-bin.tar.gz

大数据HBase界面化工具-凤凰Phoenix-压缩包 Apache Phoenix是一个开源的SQL层,为HBase提供SQL访问方式。它允许用户通过JDBC连接HBase,并将SQL查询转换为HBase的扫描操作和其他相关动作。以下是安装和配置Phoenix的步骤: 准备工作: 确保已经安装了HBase。 下载Phoenix软件包。 安装Phoenix: 创建Phoenix相关的目录结构。 mkdir -p /home/app/phoenix mkdir -p /home/app/zookeeper/data/temp 解压Phoenix软件包到创建的目录。 cd /home/app/phoenix tar -zxvf phoenix-hbase-2.3-5.1.2-bin.tar.gz 配置环境变量。 编辑\~/.bash_profile文件,添加以下命令并执行source \~/.bash_profile使更改立即生效。 export PHOENIX_HOME=/home/app/phoenix/phoenix-hbase-2.3-5.1.2-bin export PAT

2024-05-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除