自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

haleycat的博客

关注机器学习,人工智能

  • 博客(833)
  • 资源 (9)
  • 收藏
  • 关注

原创 思维链逻辑推理ReflectionAnyLLM;免费开源快速的文档扫描应用;YouTube视频摘要和问答助手

默认隐藏详细的思考过程,仅显示简要摘要,方便快速参考。

2024-09-20 09:09:42 821

原创 OpenAI或于9月24日发布ChatGPT高级语音模式

科技媒体报道,OpenAI计划在9月24日进一步推广ChatGPT的高级语音模式,预计将正式发布。该模式于7月向部分ChatGPT Plus用户开放,提供更为真实的音频响应。更新的FAQ页面显示,将邀请部分移动用户体验该模式。macOS版应用也有新进展,界面变化及新增语音选择功能。部分Alpha用户将获得语音聊天访问记忆的权限,显示出OpenAI在语音交互方面的持续探索。

2024-09-20 08:39:10 570

原创 阿里巴巴开源最新Qwen2.5系列模型

阿里巴巴推出了最大规模的开源模型Qwen2.5系列,包括Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math,具有多个不同参数版本,适用于各种业务场景。该模型在多个基准测试中展现出出色的性能,即便是较小参数的模型,在质量数据和架构的帮助下也能击败高参数模型,在能耗和环境部署方面具有优势。模型相比之前版本在预训练数据量、知识能力、生成内容、数学能力等方面都得到显著增强,使得它在各种任务和测试中表现更加出色。

2024-09-19 08:48:59 564

原创 陶哲轩对OpenAI o1模型使用体验的观察

陶哲轩在8月份使用OpenAI最新模型o1,发现其在解决数学问题方面有所进步,能成功识别克莱姆定理,但仍存在错误。虽然o1比之前的模型表现更好,但在生成独立思考方面不足。他将o1比作一名平庸的研究生,认为模型若结合更多工具和微调,将能显著提高研究效率。同时,利用大模型的效果与使用者的提示技巧密切相关,因人而异。

2024-09-18 08:54:42 433

原创 基于Llama构建的语音语言模型LLaMA-Omni;增强记忆的长文本建模检索方法;全功能的AI应用AnythingLLM

SciAgents专注于生物启发材料的研究,能够揭示以前被认为没有关系的学科间隐藏关系,超越传统人类驱动的研究方法,实现更高的规模、精度和探索能力。该模型通过利用大规模数据训练的机器人模型,展示了在真实世界中的操作和导航能力。Anything-LLM 是一款全栈应用程序,旨在帮助用户将任何文档或资源转化为可供大型语言模型(LLM)使用的上下文,从而在对话中提供更丰富的内容支持。MemLong结合了内存增强的策略,能够在处理长文本时进行更有效的信息检索,从而提升模型在长文本处理任务中的性能。

2024-09-13 08:46:08 718

原创 OpenAI发布全新o1 AI模型具备推理能力

摘要:Gemini应用已在iOS和安卓版中新增对Gem和Gem管理器的支持,用户可在主屏幕上查看聊天记录并管理自定义Gems。Gems可以帮助用户创建和保存针对特定需求的指令,提高AI助理的响应效率。用户在创建新Gems时会被引导至网页版,Gemini还需更进一步支持Google助理的部分语音功能,目前尚可通过设置切换回Google助理。更多AI工具。

2024-09-13 08:43:13 645

原创 OpenAI即将推出推理AI大模型“草莓”

OpenAI计划在未来两周内发布名为“草莓”的新AI大模型,旨在加强推理能力,提升ChatGPT服务的表现。与现有版本相比,“草莓”能够更好地处理复杂问题,但初始版仅支持文本对话,缺乏多模态能力。该模型在回答问题之前需要思考10到20秒,以减少错误并提供更详细的回答。此外,用户可能需要购买更高价的订阅以获得更快的响应速度。业界普遍认为这是人工智能发展的重要突破。

2024-09-11 08:46:41 356

原创 OpenAI Sora面临研究困境与市场误解

OpenAI的Sora模型因安全风险及与好莱坞合作问题延迟发布,外媒称其在研究上陷入困境。此外,高盛错误解读ChatGPT流量下降,导致市场对AI股票的恐慌抛售,但实际数据显示ChatGPT用户量持续增长。OpenAI正与艺人合作,进行Sora的内测,并计划在纽约艺术展中推广,同时亟需降低生成成本。尽管面临挑战,OpenAI的收入前景依然乐观。

2024-09-10 08:42:13 695

原创 马斯克否认特斯拉与xAI的交易传闻

特斯拉CEO埃隆·马斯克驳斥了《华尔街日报》关于特斯拉和xAI讨论潜在交易的报道,称特斯拉无需从xAI获取AI模型授权来支持FSD技术的发展。马斯克表示,虽然特斯拉向xAI工程师学习了很多,但两者的AI模型存在显著差异,xAI的模型过于庞大,无法在特斯拉电动车上运行。

2024-09-09 08:48:59 837

原创 OpenAI ChatGPT企业版用户突破百万

据彭博社报道,OpenAI的ChatGPT企业版已达到超过100万付费用户,涵盖ChatGPT Team、ChatGPT Enterprise及ChatGPT Edu等产品。尽管OpenAI不公布每个企业客户的平均用户数,但早前曾提及4月时有60万企业用户。企业用户主要集中在美国,德国、日本和英国也有显著使用。此外,OpenAI正考虑提高下一代AI模型的订阅费用,内部讨论了每月2000美元的可能性。

2024-09-06 08:46:37 965

原创 使用Cloudflare构建RAG应用;端到端语音开源大模型;AI幻灯片生成器,等六个开源项目

它是一个基于 SvelteKit 的应用,用于提供实时交互的聊天功能。Mini-Omni是一个开源的多模态大型语言模型,具备“听”和“说”的能力,能够实现实时的端到端语音输入与流式音频输出的对话功能。地址:https://github.com/anthropics/anthropic-quickstarts/blob/main/customer-support-agent/README.md。是一个系统化框架,通过AI推动科学研究,从原始数据到可验证的研究论文,实现透明可追溯的研究过程。

2024-09-05 11:04:08 766

原创 火爆Cursor的开源平替Melty;微软开源的agent工作流AutoGen Studio 2.0;等六个开源项目

Melty是一款开源的AI代码编辑器,旨在通过全面了解用户在命令行及GitHub的操作,协助用户编写符合生产标准的代码。该平台为用户提供了方便的界面,使得即便是初学者也能直观地定义和修改智能体及其工作流程,极大地降低了AI开发的入门门槛。Kraken 是一个开源项目,主要用于提供一个灵活和易于使用的框架,旨在简化和加速开发工作流程。在GitHub上,Kraken项目吸引了许多开发者的关注和贡献,目前已有一定数量的星标和分支。:用户可以在“构建”部分创建特定任务所需的技能,并逐步构建自定义的智能代理。

2024-09-04 09:24:59 809

原创 Meta Llama模型下载量突破3.5亿次

Meta公司近日披露,旗下Llama开源AI模型家族在上个月的下载量超过2000万次,全球累计下载量已突破3.5亿次。Llama 3.1于7月发布,支持128K的上下文长度和405B参数版本,成为用户最受欢迎的版本。Meta与多家云服务商合作,Llama在主要云平台的使用量已增至原来的两倍,未来将继续扩展合作伙伴阵容。

2024-09-04 08:43:24 615

原创 OpenAI即将推出自然语音功能

测试博客testingcatalog揭示OpenAI正在通过逆向工程ChatGPT应用,计划增加更自然的语音朗读功能。未来可能推出8种新语音,具有独特代号,能表达动物叫声等非语言声音,并在朗读加粗或斜体文字时传达情绪。这些新语音为文本到语音(TTS)技术,预计与当前高级语音模式无关。

2024-09-03 08:40:19 381

原创 智能证件照制作工具HivisionIDPhoto;免费文件翻译工具DeeplxFile;开源快速去除图片背景Remove-BG等

EasyRec 通过多个推荐数据集中的协同信息进行训练,利用用户和项目的协同个人资料作为输入,并采用新型的对比学习目标。通过将用户和项目的个人资料编码成高质量的语义嵌入,EasyRec 在基于文本的零样本推荐和增强的协同过滤场景中展现了出色的性能。HivisionIDPhoto 是一款专注于智能证件照制作的工具,利用先进的算法和模型,提供多种用户拍照场景的识别、抠图及证件照生成服务。EasyRec是一种基于语言模型的推荐系统,通过对用户和物品的协同信息进行处理,提升推荐效果。

2024-08-30 13:50:19 1310

原创 OpenAI AI 聊天机器人周活跃用户超 2 亿

科技媒体 Axios 报道,OpenAI 的 AI 聊天机器人在短短一年内实现了周活跃用户超过 2 亿的增长。该公司表示,全球财富 500 强企业中已有 92% 使用其产品,并且自 7 月份发布 GPT-4o mini 以来,其自动 API 使用量也翻了一番。首席执行官山姆・阿尔特曼指出,该工具已有效融入医疗和教育等领域,帮助用户完成日常任务和解决问题。同时,Meta 公司的 Llama 模型也经历了快速增长。

2024-08-30 09:12:49 1155

原创 OpenAI融资谈判 估值或超1000亿美元

OpenAI正在进行一轮融资谈判,预计估值将超过1000亿美元,主导投资方为Thrive Capital,将投资10亿美元。今年早些时候,OpenAI估值已超过800亿美元,自ChatGPT推出后业绩大幅增长,并扩展至多个AI产品领域。微软作为最大支持者也参与了此次融资,但未对此发表评论。

2024-08-29 09:08:52 817

原创 FinGPT开源的金融大模型;自动视频生成器;视频人脸超分辨率提升器;Anthropic提供四个教育课程

它的设计背景基于金融数据的动态性及用户对实时信息的需求,通过轻量级的适应方式,快速更新模型,以便更好地应对快速变化的市场环境。它通过4位量化(AWQ)和TinyChat框架支持边缘设备部署,且在图像与文本的交错预训练中发现了诸多重要特性,比如需要交错图像-文本对而非单一图像-文本对,以及在交错预训练中解冻大语言模型(LLM)以实现上下文学习的能力。Superposition Prompting可以看作是一种创新的提示工程策略,它能够整合不同类型的知识或信息,从而使模型生成更为精准和上下文相关的输出。

2024-08-28 08:48:52 862

原创 OpenAI神秘“草莓”项目将推出新AI产品

OpenAI近日透露代号为“草莓”的新AI项目,旨在提升模型推理能力,解决复杂数学和科学问题。该技术已向美国国家安全官员展示,预计将于今年秋季与聊天机器人结合推出。此项目的目标是让AI能处理以往未见的问题,超越现有AI的局限,实现自主、可靠的信息检索和深度研究。

2024-08-28 08:46:03 426

原创 Anthropic公开Claude AI系统提示词

Anthropic公司近日公开了Claude AI模型的系统提示词,旨在提高AI模型对人类指令的理解。系统提示词设定了对话背景和行为规则,通常是为了防止模型出现不良行为。Anthropic强调其透明度和道德性,计划定期更新并发布系统提示。此举与业界普遍保密的做法形成对比,反映出公司对提升用户安全感和信任度的重视。

2024-08-27 09:10:59 642

原创 微软在Edge浏览器中引入本地AI模型;苹果将于9月10日发布iPhone 16系列

微软正在探索在Microsoft Edge浏览器中引入名为Phi3 Mini的本地AI模型,旨在提升用户交互体验。最新的Canary版Edge浏览器中出现了“Prompt API for Phi3 Mini”的实验性选项,用户可通过自然语言指令与内置的大语言模型互动。该API主要用于自然语言处理任务,如文本总结和分类,但不适用于要求事实准确性的场景,并需遵守使用政策。

2024-08-26 09:04:11 538

原创 Midjourney推出网页版编辑器应对Ideogram 2.0冲击

随着Ideogram 2.0的发布,AI图像生成市场竞争愈发激烈,Midjourney感受到危机,于上周推出了网页版图像编辑器,并恢复免费试用功能。尽管Midjourney 6.1版本在画质上有所提升,但创新不足,用户付费意愿下降。而Ideogram 2.0则以更高的生成质量和多样化的功能吸引用户,包括文本渲染和多个图像风格。未来,Midjourney的市场地位将如何发展,值得关注。

2024-08-23 09:16:13 714

原创 OpenAI推出GPT-4o微调功能

OpenAI近日推出了一项新功能,允许企业客户使用自有数据对GPT-4o模型进行微调,以优化针对特定任务的表现。这一举措旨在增强企业AI应用的投资回报,简化操作流程。企业需将文本数据上传至OpenAI服务器进行微调,平均耗时一到两个小时。此项功能的开放,使得企业能够更直接地利用OpenAI的最强大模型,无需依赖外部服务。

2024-08-21 09:09:36 556

原创 未来感十足的AI驱动网络爬虫工具;自然语音生成与音色模拟ChatTTS-OpenVoice;基于人工智能的问答引擎Sensei

CyberScraper 2077 是一款先进的网页数据提取工具,融合了人工智能技术,旨在以无与伦比的精准度和风格提取网络数据。该工具通过 ChatTTS 提供更自然的声音生成,并结合 OpenVoice 的音色模拟功能,实现无缝的语调迁移。:系统基于 Next.js 和 FastAPI 构建,使用多种开源 LLMs,如 Command-R、Qwen-2 和 GPT-3.5-turbo,支持高效的数据处理和响应生成。在元代理搜索中,一个“元”代理根据之前的发现,迭代地在代码中编程有趣的新代理。

2024-08-20 20:18:43 571

原创 AI图像生成新星Flux崛起;谷歌AI技术领先 苹果需努力追赶

初创公司Black Forest Labs推出的AI图像生成模型Flux迅速走红,参数高达120亿,图像质量堪比真实照片。Flux在人物表情、细节处理及生成手部图像方面表现优异,超过了Midjourney和DALL-E等现有模型。Flux提供多个版本,包括开源与闭源选项,支持用户在普通硬件上运行,增强了可及性。市场上已有多个平台引入Flux模型,表明其在生成式媒体行业的潜力和影响力。

2024-08-19 09:19:39 537

原创 维基百科向量搜索;简单易用的GraphRAG实现;友好的人工智能助手;AI的音乐多模态

Fish是一个基于变换器(Transformer)的混合多模态模型,专注于音乐信息检索领域,能够生成歌曲的和弦、节拍、歌词、旋律和谱表。GGUF 格式的量化支持主要适用于变换器和 DiT 模型(如 flux),相比传统的 UNET 模型(conv2d),量化带来的影响较小,使得在低端 GPU 上运行低位数的权重变量量化成为可能。该项目是一个AI驱动的多模态音乐项目,旨在为任何歌曲生成对应的信息,包括和弦、节奏、歌词、旋律等。ComfyUI-GGUF支持GGUF格式的模型量化,优化低端GPU上的运行效率。

2024-08-18 09:47:06 1323

原创 清华大学LongWriter语言模型

为了解决这个问题,作者引入了AgentWrite,这是一种基于代理的流程,将超长生成任务分解为子任务,使现成的LLMs能够生成超过20,000字的连贯输出。为了确保输出的连贯性,当我们调用模型生成第n段时,我们还输入之前生成的n−1段,让模型基于现有的写作历史继续写下一段。尽管这种串行方式防止了并行调用模型同时完成多个子任务,并且输入长度变得更长,但我们的验证显示,通过这种方式获得的写作整体连贯性和质量远优于并行生成的输出。在当今信息爆炸的时代,写作已不仅仅是表达思想的工具,更是沟通、分享和影响的桥梁。

2024-08-18 09:46:09 1064

原创 谷歌发布会展示强大AI功能,苹果落后数年

在8月15日的发布会上,谷歌推出了Pixel 9系列及其全新AI功能Gemini,业内普遍认为苹果在AI技术方面至少落后谷歌两到三年。谷歌强调Gemini在Android和Pixel手机上的深度整合及多语种支持,而苹果的Apple Intelligence在应用上尚不成熟。值得关注的是,谷歌的下一代自研芯片预计将进一步提升AI性能,而苹果在AI软件领域的进展明显滞后。

2024-08-16 09:17:01 551

原创 xAI发布Grok-2和Grok-2 mini AI模型

摘要:苹果官方宣布,Apple Watch无法直接支持Apple Intelligence功能,但搭载iOS 18.1的iPhone用户可享受AI通知摘要特性。该特性通过AI总结Messages和Mail等应用的通知内容,提升信息获取的效率。虽然Apple Watch不具备此功能,但iPhone可将总结后的通知发送至手表。科技媒体提到,苹果可考虑在Apple Watch上整合更多AI功能,以改善用户体验。更多AI工具。

2024-08-15 09:13:11 727

原创 Sakana 推出开源AI Scientist:科研论文编写一条龙搞定

为了解决这个问题,Sakana AI推出了“AI科学家”(The AI Scientist),这是一个全面自动化科学发现的系统。尽管该论文存在一些瑕疵(例如,对其方法成功原因的解释稍显不充分),但它提出了一个有趣的新方向,并在AI科学家自己进行的实验中显示了良好的实证结果,并经过了自动化同行评审。想象一下,一个不眠不休的研究助手,能够在没有人类监督的情况下,独立进行科学研究,从提出新想法到执行实验,再到撰写论文,全部自动完成。:论文生成后,AI科学家会进行自动化的同行评审,为改进研究和未来的创意提供反馈。

2024-08-14 20:11:21 492

原创 新AI工程师Genie强势来袭,84秒解决代码问题

新兴AI软件工程师Genie因其超凡能力而引发关注,它在SWE-Bench排行榜上以30.07%的问题解决率远超第二名。Genie能模拟人类工程师的思维,自动解决软件问题,仅需84秒即可完成代码的写作与调试,成绩得益于其背后仅5人的Cosine团队的努力与OpenAI的大模型支持。其训练方法创新地基于人类程序员的开发数据,使其在处理复杂问题上表现出色。

2024-08-14 09:14:20 499

原创 开源工具提升你的生产力

如果你想摆脱大科技公司的专有控制,有一些选择是很好的。每一个阴都有一个阳;每一个动作都有一个反作用力;每一个专有软件都有一个开源替代品。大概就是这样的。在过去的几年里,技术中的“开放性”问题在公众意识中从未如此突出。Twitter的逐步衰落使得数百万人开始探索替代品,其中许多是开源的。去年OpenAI的权力斗争也让人们关注到在蓬勃发展的人工智能革命背景下,“开源”实际上意味着什么。

2024-08-13 19:59:47 1086

原创 毒舌 AI 应用成全球爆款,创造高收入

一款名为“毒舌 AI”的应用在社交媒体上流行,用户可通过输入推特用户名获取针对历史发言的点评。该应用在全球迅速吸引用户,达到500万用户,并在日本单小时赚取4000美元。创作者们因流量激增面临资金压力,决定开启付费模式。此应用利用低代码平台Wordware快速开发,展现了大语言模型的潜力,同时开发团队希望借此改变AI在企业应用中的使用方式。

2024-08-12 09:52:37 386

原创 Apple Intelligence提示词曝光:Do not hallucinate;XLabs-AI 又发布两个脚本x-flux;吴恩达亲自主讲AI基础教程

这些指令旨在指导AI聊天机器人如何回应用户。还有一段指令明确提到,AI生成“Memories”视频时应避免涉及宗教、政治、有害、暴力、色情、肮脏或任何负面、悲伤或挑衅性的主题。苹果在其最新的开发者测试版中推出了一些生成型AI功能,这些功能已经在WWDC大会上宣布,计划在未来几个月内陆续登陆iPhone、iPad和Mac等设备。x-flux是由XLabs-AI开发的一种称为Flux的模型,该项目由XLabs AI团队发布了一系列用于微调Flux模型的训练脚本,包括LoRA和ControlNet。

2024-08-08 10:40:55 707

原创 零一万物完成数亿美元融资;OpenAI 引入 API 结构化输出功能

8 月 6 日,OpenAI 发布新闻稿,宣布在 API 中引入结构化输出功能。这一功能确保模型响应符合用户提供的 JSON 模式,提升响应可靠性和一致性。新模型 gpt-4o-2024-08-06 在复杂 JSON 模式评估中实现了 100% 满分,大幅超过 gpt-4-0613 的成绩。

2024-08-08 09:13:21 1085

原创 Lumina-mGPT图像生成;清华大学研发的首个开源预训练文本生成视频模型;Medical SAM 2实现2D和3D医学图像分割

这对于最新发布的 GPT-4o 型号适用,包括 gpt-4o-2024-08-06 和 gpt-4o-mini-2024-07-18。是一个敏捷的信息提取工具,能够从各种来源(如网站、微信公众号、社交媒体平台)中,根据预定义的关注点提炼信息,自动对标签进行分类,并上传到数据库。地址:https://openai.com/index/introducing-structured-outputs-in-the-api/从文本描述生成对应的高质量图像。例如,输入一张图像,模型可以生成该图像的详细文字描述。

2024-08-07 10:05:06 1099

原创 四个开源的模拟人类记忆开源库

Memary 提供了自动生成记忆、记忆模块、系统改进和回溯记忆等功能,以便在最小的开发者实现下,提升代理的智能化程度。:Memary 支持不同数据格式的解析和清洗,以便更好地将私有数据注入代理记忆,同时也提供多种检索技术,以提高记忆的访问和利用效率。:Memary 可以跟踪和分析用户的偏好变化,帮助理解用户的兴趣点,并通过记忆模块调整代理的响应策略。:通过知识图谱管理和回溯功能,开发者可以在交互中实时注入新的知识点,也可以查看和调试代理的历史记忆。:包括用户、会话和AI代理的记忆保留。

2024-08-06 10:50:33 1014

原创 模拟人类记忆、增强AI代理的开源库;集日历、待办事项、笔记和语音助手;开源最新技术的开源AI搜索引擎

Memary 提供了自动生成记忆、记忆模块、系统改进和回溯记忆等功能,以便在最小的开发者实现下,提升代理的智能化程度。家长们特别赞赏该应用在管理家庭事务、减少压力方面的帮助。:Memary 支持不同数据格式的解析和清洗,以便更好地将私有数据注入代理记忆,同时也提供多种检索技术,以提高记忆的访问和利用效率。:Memary 可以跟踪和分析用户的偏好变化,帮助理解用户的兴趣点,并通过记忆模块调整代理的响应策略。:通过知识图谱管理和回溯功能,开发者可以在交互中实时注入新的知识点,也可以查看和调试代理的历史记忆。

2024-08-06 10:41:11 789

原创 本地化AI语音聊天voicechat2;改进版的Whisper模型,速度快50%;多代理创建儿童图画书

voicechat2是一款使用WebSockets进行快速、本地化AI语音聊天的软件。Voicechat2 是一个快速、完全本地化的AI语音聊天系统,采用WebSockets技术。它运行在高性能硬件上,例如7900级的AMD RDNA3显卡或4090显卡,可以实现低至1秒甚至300毫秒的语音到语音延迟。它使用了多个先进的AI模型和工具,包括Whisper、Llama和Coqui TTS。:实现与AI助手的实时语音互动,如智能客服、AI陪聊等。:实时语音指导和解答问题,为学生提供即时反馈。

2024-08-05 10:29:16 855

原创 Character.AI的联合创始人Noam Shazeer将加入谷歌;又一个开源平替llamacoder;和mem0一样的动态记忆框架

Character.AI的联合创始人Noam Shazeer和Daniel De Freitas离开公司,重新加入Google旗下的DeepMind研究团队。地址:https://techcrunch.com/2024/08/02/character-ai-ceo-noam-shazeer-returns-to-google/AdvancedLivePortrait是LivePortrait的提升版,用于在视频中添加面部表情的工具,通过自定义工作流实现。公众号:每日AI新工具。

2024-08-03 14:03:56 783

Android中使用FCM进行消息推送

Android中使用FCM进行消息推送完整的过程,包括在控制板中配置项目,安卓应用构建,在服务端中发送fcm消息。

2023-03-24

驱动开发的相关工具DebugView

包含DebugView,DriverMonitor,IRPTrace,WinObj,DeviceTree,DiskView,DriverManager,EzDriverInstaller

2022-06-13

PngButton.zip

MFC中把png资源加载到自定义按钮,可以了解到mfc中如何控制按钮的编写。

2019-08-08

WebRTC零基础开发者教程(中文).pdf

本文中提供下载的《WebRTC 零基础开发者教程》将以一个初学者的角度,从0开始逐步引导你掌握WebRTC开发的方方面面(当然,教程中更多的是操作性的内容,具体到技术原理和实现,显然不是本教程的讨论范畴)。

2019-06-14

webrtc.zip

WebRTC is a free, open project that provides browsers and mobile applications with Real-Time Communications (RTC) capabilities via simple APIs. The WebRTC components have been optimized to best serve this purpose. Our mission: To enable rich, high-quality RTC applications to be developed for the browser, mobile platforms, and IoT devices, and allow them all to communicate via a common set of protocols. The WebRTC initiative is a project supported by Google, Mozilla and Opera, amongst others. This page is maintained by the Google Chrome team.

2019-06-12

Getting-Started-with-Webrtc-2013-Rob-Manson.pdf

WebRTC(Web Real-Time Communication)项目的最终目的主要是让Web开发者能够基于浏览器(Chrome\FireFox\...)轻易快捷开发出丰富的实时多媒体应用,而无需下载安装任何插件,Web开发者也无需关注多媒体的数字信号处理过程,只需编写简单的Javascript程序即可实现,W3C等组织正在制定Javascript 标准API,目前是WebRTC 1.0版本,Draft状态;另外WebRTC还希望能够建立一个多互联网浏览器间健壮的实时通信的平台,形成开发者与浏览器厂商良好的生态环境。同时,Google也希望和致力于让WebRTC的技术成为HTML5标准之一,可见Google布局之深远。

2019-06-11

Android开发艺术探索

《Android开发艺术探索》是一本Android进阶类书籍,采用理论、源码和实践相结合的方式来阐述高水准的Android应用开发要点。《Android开发艺术探索》从三个方面来组织内容。第一,介绍Android开发者不容易掌握的一些知识点;第二,结合Android源代码和应用层开发过程,融会贯通,介绍一些比较深入的知识点;第三,介绍一些核心技术和Android的性能优化思想。

2019-02-27

21个项目玩转深度学习:基于TensorFlow的实践详解

我们正处在一个日新月异、飞速变革的时代,层出不穷的新技术每天都在冲击和改变我们的生活。人工智能无疑是其中最受关注、也是影响最深远的技术领域。它为计算机插上了翅膀,演变出许多从前根本无法想象的新技术、新应用。AlphaGo Zero——一台没有任何先验知识的人工智能机器,可以在几天内通过自我博弈成长为世界第一的围棋大师,超越人类几千年积累的经验;风格迁移应用能够自动将用户的照片转变为著名的绘画艺术风格;机器可以在零点几秒内完成翻译,把一种语言译成另一种语言。此外,有关人脸识别、自动驾驶等新技术的应用也都纷纷开始落地。在过去的几年内,人工智能技术不仅在学术上取得了巨大的突破,也开始走向寻常百姓家,真正为人们的生活提供便利。

2018-12-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除