自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (1)
  • 收藏
  • 关注

原创 计算机视觉入门

计算机视觉是人工智能领域的一个重要分支,它致力于使计算机系统从图像或视频中获取信息、理解场景,并做出相应的决策或操作。

2024-04-12 23:54:56 232

原创 常见分类算法

线性判别分析 (Linear Discriminant Analysis, LDA):是一种统计学方法,通过投影将数据映射到最佳线性判别超平面,使得同类样本尽可能靠近,异类样本尽可能远离,适用于小样本、多类别的分类问题。决策树易于理解,能够处理离散和连续特征,并能可视化。K-近邻算法 (K-Nearest Neighbors, KNN):基于实例的学习方法,通过计算新样本与训练集中每个样本的距离,找出最接近的K个邻居,然后根据这些邻居的多数类别来决定新样本的类别。其优点是计算效率高,尤其适合大规模数据。

2024-04-12 23:50:55 324

原创 Udio AI ,利用人工智能创作音乐

Udio AI 得到了音乐和技术界的著名人士的支持,包括 will.i.am、Common、Kevin Wall、Tay Keith、Steve Stoute 的 UnitedMasters、Instagram 的联合创始人和首席技术官 Mike Krieger 以及 Oriol Vinyals(Google 的 Gemini 负责人)。Udio AI 是一个将改变音乐行业的平台。它的 AI 驱动的音乐创作工具使任何人在瞬间创作出杰出的音乐成为可能,这使它成为音乐爱好者、内容创作者和专业人士的有价值工具。

2024-04-12 23:46:39 380

原创 微软推出引领选择性语言模型: Rho-1

结果令人惊讶,Rho-1-1B 和 7B 在 MATH 数据集上分别实现了 40.6% 和 51.8% 的最先进结果,这与 DeepSeekMath 相当,后者使用了 30% 更多的预训练令牌。通过关注一小部分令牌,Rho-1 在各种任务中取得了令人印象深刻的结果,特别是在数学任务中,Rho-1 取得了显著成绩。Rho-1 的选择性语言模型方法为更有效的语言模型预训练提供了一条有前途的路径。Rho-1 模型展示了选择性语言模型的潜力,这是自然语言处理的一个子领域,专注于识别和处理给定任务中最相关的令牌。

2024-04-12 23:45:32 219

原创 浏览器背后的强大引擎--webkit

Webkit的跨平台特性使其不仅能服务于桌面浏览器,还广泛应用于移动设备(如iOS和Android)、嵌入式系统、智能电视等多元化的硬件环境,为用户提供一致且高效的Web体验。Webkit作为现代浏览器的核心引擎,以其开源、高性能、对Web标准的深度支持等特点,在Web开发领域扮演着不可或缺的角色。不同的浏览器或应用可能采用不同的UI框架,Webkit通过与各平台特定的用户界面库集成,为开发者提供统一的API接口,实现与渲染引擎的交互,如创建窗口、处理用户输入事件、调用WebCore功能等。

2024-04-11 23:20:15 559

原创 Fiddler的安装与操作

反之,要加载已保存的会话,选择“File” → “Load” → “SAZ File”。Windows:依次点击“Tools” → “Options” → “Connections”,确保“Allow remote computers to connect”选项被勾选,并记下显示的监听端口(默认为8888)。设置断点:右键点击请求,选择“Breakpoints” → “Before Request”/“After Response”,可在请求发送前或响应返回后暂停,进行手动干预或观察中间状态。

2024-04-11 23:16:41 354

原创 MuPT: 一个用于生成符号音乐的大语言模型

MuPT的实现方法是,它使用了大型的音乐数据集,如MIDI文件、音乐XML等,来训练模型。通过对数据集的预处理和特征提取,MuPT可以学习到音乐特征的表示方法,如音高、音程、音调等。MuPT的发展背景是,现代音乐创作和演出中,使用符号音乐表示和处理音乐特征已经成为了一种常见的做法。然而,使用符号音乐表示音乐特征的方法仍然存在一些挑战,如数据集的构建、特征的提取和模型的训练等。MuPT使用了大型预训练Transformer架构,可以生成符号音乐的各种特征,如音高、音程、音调等。

2024-04-11 23:03:11 343

原创 MagicTime:时序视频生成模型作为模拟器

MagicTime的代码基础是Animatediff和Open-Sora-Plan,这两个项目分别是一个强大的U-Net-based text-to-video生成模型和一个简单且可扩展的DiT-based text-to-video生成库。高质量视频-文本数据和数据注释管道: MagicTime提供了高质量的视频-文本数据和数据注释管道,以支持Open-Sora-Plan或其他DiT-based T2V模型。论文地址: https://arxiv.org/abs/2404.05014。

2024-04-11 23:02:36 186

转载 Google Vids: AI驱动视频创作

Google 推出了一款新的基于人工智能的视频创作应用程序,名为 Google Vids,旨在帮助用户轻松分享想法并创建丰富的视频内容。这款新应用程序预计将集成到 Google Workspace 生产力套件中,提供视频创作工具,并与 Google Workspace 中的其他应用程序,如 Docs 和 Sheets 并行使用。然后,用户可以从他们的 Google Drive 中访问文件或使用 Google 提供的股票内容,并且 AI 会根据他们的想法生成一个故事板。

2024-04-11 23:00:18 48

转载 Parler-TTS: 高质量的文本转语音平台

Parler-TTS是一款颠覆性的文本转语音平台,正在改变我们与数字内容互动的方式。这一创新技术旨在将书面文本转换为自然流畅的语音,成为个人和企业不可或缺的工具。

2024-04-11 22:55:09 266

原创 Ferret-UI: 多模态 LLM 在移动 UI 理解领域的突破

Ferret-UI 是一种新型的多模态大语言模型(MLLM),专门针对移动用户界面(UI)屏幕的理解和交互进行了优化。与一般领域的 MLLM 相比,Ferret-UI 在理解和操作 UI 屏幕方面表现出色,不仅超越了大多数开源 UI MLLM,还在所有基础 UI 任务上超越了 GPT-4V。

2024-04-10 23:21:57 498

原创 HairFastGAN: 快速高效的发型转移技术

HairFastGAN是一种基于编码器的快速发型转移方法,由AIRI研究所开发。该方法能够在不到一秒的时间内,将一张图像的发型形状和颜色转移到另一张图像上,实现了高度逼真和鲁棒的发型编辑效果。

2024-04-10 23:20:23 508

原创 Github开源: 免费的编程中文书籍索引

github地址: 免费的编程中文书籍索引该项目目前star109k, 收录了几乎所有语言的书籍, 值得收藏看看.

2024-03-30 22:11:21 191

原创 Hume AI发布EVI : 具有情感感知能力

并且捕捉你说话的语调、节奏、音色,以及所说的语言间的细微差别,生成自己的声音和语言,构建回应。更有意思的是,EVI 还不会打断对话。如果你突然打断它,它会像真人一样停下来听你说。这种技术结合了大型语言模型(LLMs)的语言理解能力和表情测量技术的情感感知能力。EVI采用了一种被称为情感大语言模型(eLLM)的多模态生成AI技术。体验链接:https://demo.hume.ai/官网地址:https://www.hume.ai。

2024-03-30 00:22:11 520

原创 8个实用的AI网站推荐

ClipDrop能去除或替换背景、移除图片中的物体、人物或缺陷、图像放大和将涂鸦转换成真实图片。创造具备人物一致性的AI图像 创造具备完全控制和一致性的AI人物。视频创作的新时代 通过结合AI生成的图像、音乐和逼真的声音,雇佣AI员工,全自动运营你的销售、设计和执行助理工作。一键修图 在几秒内删除照片中的任何不需要的物体。创建你自己的AI克隆,创造无限创造力的完美图像。更聪明更快速地学习新语言 学习真正需要的单词,感受第一个能够提升性能的AI助理的力量。你的个人AI工作空间。

2024-03-30 00:18:31 282

原创 postcss的安装及使用

在现代前端开发中,PostCSS已经成为一个不可或缺的工具。作为一款强大的样式处理器,PostCSS通过插件化的方式,能够将CSS扩展至超越其原生能力的边界,实现自动化预处理、功能增强、优化压缩等任务。本文将详细介绍如何安装PostCSS,并指导您如何在实际项目中有效地使用它。

2024-03-29 23:59:54 1006

原创 npm常用命令

npm,作为Node.js生态系统的基石,扮演着至关重要的角色。它是全球最大的开源软件注册表,同时也是Node.js项目的包管理器,让开发者能够轻松地安装、共享和管理项目依赖。本文旨在系统性地梳理npm的常用命令及其应用场景,助力开发者提高工作效率,解决日常开发过程中的依赖管理问题。

2024-03-28 21:45:08 189

原创 yarn的安装与使用详解

yarn,全称为“Yet Another Resource Negotiator”,是Apache Hadoop项目的重要组件,它作为Hadoop 2.x版本的核心资源管理系统,负责统一管理和调度集群的所有计算资源。本文将详细介绍YARN的安装步骤以及基本使用方法,助您轻松掌握这一强大的分布式计算框架。

2024-03-28 21:35:07 323

原创 Android开发提高的十六技

整理了一份安卓开发的资料。从基础开发到进阶技术再到游戏开发都有。

2024-03-28 17:41:48 342

原创 Java大厂面试资料包,需要的同学可自取。

整理了一份大厂Java大佬的超实用面试题库,需要的同学可自取。

2024-03-28 15:54:08 127

原创 隐私政策

隐私政策移动资讯尊重并保护所有使用服务用户的个人隐私权。为了给您提供更准确、更有个性化的服务,移动资讯会按照本隐私权政策的规定使用和披露您的个人信息。但移动资讯将以高度的勤勉、审慎义务对待这些信息。除本隐私权政策另有规定外,在未征得您事先许可的情况下,移动资讯不会将这些信息对外披露或向第三方提供。移动资讯会不时更新本隐私权政策。 您在同意移动资讯服务使用协议之时,即视为您已经同意本隐私权政策全部...

2019-04-26 15:00:57 264

原创 iOS 隐私政策

隐私政策爱秀尊重并保护所有使用服务用户的个人隐私权。为了给您提供更准确、更有个性化的服务,爱秀会按照本隐私权政策的规定使用和披露您的个人信息。但爱秀将以高度的勤勉、审慎义务对待这些信息。除本隐私权政策另有规定外,在未征得您事先许可的情况下,爱秀不会将这些信息对外披露或向第三方提供。爱秀会不时更新本隐私权政策。 您在同意爱秀服务使用协议之时,即视为您已经同意本隐私权政策全部内容。本隐私权政策属于爱...

2018-10-22 17:47:04 255

原创 iOS 隐私政策

隐私政策 VideoFun尊重并保护所有使用服务用户的个人隐私权。为了给您提供更准确、更有个性化的服务,VideoFun会按照本隐私权政策的规定使用和披露您的个人信息。但VideoFun将以高度的勤勉、审慎义务对待这些信息。除本隐私权政策另有规定外,在未征得您事先许可的情况下,VideoFun不会将这些信息对外披露或向第三方提供。...

2018-10-04 09:56:14 1131

js权威指南

本书是js开发基础教程,内容翔实,语言生动。作者结合大量实例。循序渐进地讲解了js开发的基本流程。

2018-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除