写在前面
【WeThinkIn老实人报】旨在挖掘AI行业的关键新闻和最新技术,同时Rocky会对其中的关键信息进行解读,力求让读者们能从容掌握AI科技潮流。
欢迎大家关注Rocky的公众号:WeThinkIn
欢迎大家关注Rocky的知乎:Rocky Ding
AIGC算法工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~
获取更多AI行业的前沿资讯与干货资源
AIGC时代的 《三年面试五年模拟》AI算法工程师求职面试秘籍独家资源: https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main
Rocky最新撰写10万字Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章: https://zhuanlan.zhihu.com/p/684068402
大家好,我是Rocky。
阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:
- 掌握AIGC、传统深度学习以及自动驾驶这三个AI行业核心方向的最新进展,并能在评论区发表观点,能够持续学习交流。
- 挖掘让自己灵光一现的深度思考、关键新闻以及最新技术,这让我们的职业生涯产生更多可能性。
- 理顺国内AI行业头条新闻、全球AI行业头条新闻、重点AIGC事件战略分析、AI产业链融资新闻以及AI技术进展头条新闻五大板块,降低我们对未来下一个核心价值(DeepSeek式公司和AIGC式技术)的错判率。
本文是《WeThinkIn老实人报》的第四十一期,Rocky本次梳理的周期为2025年1月6号-2025年2月4号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家带来更多思考与感悟。
So,enjoy!
正文开始
【一】目录先行
- 读前大局观
- 国内AI行业头条新闻
- 全球AI行业头条新闻
- 重点AIGC事件战略分析:DeepSeek带来的核心价值是什么?
- AI产业链融资新闻
- AI技术进展头条新闻
【二】读前大局观
Rocky将工业&科技分为三个维度:
- 尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。
- 中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。
- 基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。
我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。
在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。
在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧全球最新趋势,问题不大的。在AI行业的政策、资本、生产资料、认知等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。
【三】国内AI行业头条新闻
3.1 AIGC产业新闻:
1、阿里巴巴:淘宝上线AI产品“生意管家”已累计服务400万商家,帮助中小商家生成超1亿件商品及营销素材。
2、上海人工智能实验室成立国内首个医疗大模型应用检测验证中心,打通“训、评、用一体化”链路。
3、阿里通义千问推出全新AI框架Qwen-Agent,赋能开发者构建更强大的AI智能体。
4、李开复辟谣零一万物将预训练团队和算力资源打包出售给阿里:完全没有的事。
5、昆仑万维:「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用。
6、捷成股份AI智能视频创作引擎捷成创视(ChatPV)推出“文生视频”全新功能模块。
7、均普智能推出工业大模型应用“企业AI知识库搜索平台”和“AI代码编程助手”,人工智能体系化战略加速落地。
8、阿里云宣布通义灵码AI程序员全面上线,可通过对话协作的方式辅助开发者完成复杂编码任务。
9、科大讯飞发布业界首个全国产算力平台深度推理模型X1,中文数学能力对标GPT-3。
10、中国信通院发布MaaS六大标准,解决AI模型落地“最后一公里”难题。
11、阿里旗下通义万相宣布推出 2.1 版本模型升级,视频生成、图像生成两大能力均有显著提升。
12、商汤正式推出“日日新”融合大模型:实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升。
13、阿里妈妈推出商用级图生视频AI Native应用“淘宝星辰·图生视频”,目前已对淘宝、天猫商家开放使用。
14、腾讯会议宣布产品升级,基于腾讯混元大模型推出腾讯会议AI小助手Pro。
15、科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型“讯飞星火深度推理模型X1”:中文数学能力国内第一,并已率先应用于教育、医疗等刚需场景。
16、360集团创始人周鸿祎参与拍摄并出演的国内首部“AI短剧”已在西安开机,计划于春节期间上线。
17、腾讯宣布推出AI生成文本检测与AI生成图像检测工具,旨在通过AI技术 “打假AI”。
18、豆包实时语音大模型正式上线,并在豆包App全量开放:实现端到端语音对话,情商智商双高。
19、商汤科技日日新融合大模型交互版(SenseNova-5o)开放商用,实时音视频对话限时免费。
20、月之暗面推出Kimi全新SOTA模型k1.5多模态思考模型,实现SOTA级别多模态推理和通用推理能力。
21、腾讯混元宣布开源3D生成大模型2.0版本,并上线业界首个一站式3D内容AI创作平台“混元3D AI创作引擎”。
22、百度文库AI功能月活用户突破9000万,DAU同比增长230%,付费用户数超4000万。
23、中国石化推出我国石油石化行业首位AI数字员工,并在广西南宁新阳站等全国40余座加能站同步试点上岗。
24、网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”并正式开源:为14B参数规模的轻量级单模型,支持在消费级显卡上部署。
25、百川智能发布全场景深度思考模型Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力。
26、中科闻歌推出基于雅意大模型、面向全行业的一站式智能体开发平台“智川”X-Agent,极速定制企业级智能体应用。
Rocky观点:2025年开始,DeepSeek系列的问世彻底重构了全球AIGC产业生态,预计会有更多大模型更新发布,并延伸到落地应用与商业化,迭代优化和存量厮杀将会更加明显。在ToC、ToB两个方向上同时打响价格战,全面进入大模型你死我活厮杀的关键阶段。
3.2 新能源产业新闻:
1、雷军:小米汽车工厂开放对外参观预约,已有超8800人报名。
2、亿航智能与山东威海高区签署项目合作协议,共建无人驾驶eVTOL产业生态。
3、雷军:小米澎湃秒充技术将面向车企、终端厂商、配件厂商免费开放。
4、雷军:小米集团“百万美金技术大奖”升级为“千万技术大奖”,今年获奖项目为“小米超级电机V8s”项目组。
5、光启技术“先进低空无人机产业链总部基地项目”在四川乐山启动,共筑低空无人机产业新生态。
6、新石器无人车获国家邮政局“无人驾驶技术研发中心”权威认证,领航“无人配送”新赛道。
7、华为乾崑智驾泊车代驾VPD全球首个机场商用试点在深圳机场启动,旨在为旅客提供更加便捷、智慧的出行体验。
8、新吉奥房车正式在香港交易所主板挂牌上市,成为“中国房车第一股”。
8、京东物流推出全新一代JDX20“京鹊”多旋翼智慧物流无人机,持续发力低空经济。
9、乐聚机器人宣布将第100台全尺寸人形机器人交付北汽越野车,成为全球范围内公布交付数量最多、场景最多的人形机器人企业。
10、小米首座智能家电工厂结构已经顺利封顶:将自研自产小米空调,预计11月完成竣工验收并进入量产阶段。
11、京东物流自研MRV-T数字化减碳技术获国家发改委等部门认可,物流行业唯一入选《绿色技术推广目录(2024年版)》。
12、特斯拉官宣:2025年特斯拉中国首批V4超级充电站即将落地,将向更多三方车型开放。
Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。
3.3 传统深度学习&芯片产业新闻:
1、华为预制模块化数据中心位居全球市场份额第一,已连续十年蝉联全球第一。
2、三六零集团旗下纳米AI搜索、360AI办公鸿蒙原生版正式上线,助力实现大模型时代的人人普惠。
3.4 互联网产业新闻:
1、第四届字节跳动奖学金获奖名单公布:来自8所院校15位同学获奖,每人获得10万元奖学金。
2、支付宝“2025年集福”正式开启:新增28套特色主题福卡,用户可任选5套来集,开奖机会从1次变5次,每集齐1套福卡即可立刻开奖。
3、小米正式进军韩国市场:将依次推出智能手机、电视机、扫地机器人等产品,之后计划开设线下实体店。
4、Brand Finance 2025年全球品牌价值500强榜单出炉:苹果稳居榜首,TikTok跻身第七。
3.5 商业基本面新闻:
1、中国互联网络信息中心:截至2024年12月中国网民规模达11.08亿人,互联网普及率升至78.6%。
【四】全球AI行业头条新闻
4.1 AIGC产业新闻:
1、马斯克:Grok 3预训练已完成,即将推出,计算量比Grok 2高10倍。
2、英伟达成立ASIC部门,计划招募上千名人才加速AI领域布局。
3、赛轮思宣布扩大与英伟达的合作,以提升其CaLLM™系列语言模型的功能。
4、三星发布Samsung Vision AI等多项创新,为用户带来个性化的AI屏幕体验。
5、人工智能初创公司Anthropic计划筹资20亿美元,估值高达600亿美元。
6、AMD将向生成式AI药物研发公司Absci战略投资2000万美元,共同部署AMD Instinct加速器和ROCm软件。
7、全球图库巨头Getty Images宣布和Shutterstock达成最终合并协议,将组建全球一流的视觉内容公司。
8、谷歌宣布将AI Studio团队整体转移至DeepMind旗下,整合人工智能部门项目提升效率。
9、OpenAI重启机器人部门并发出首份招聘,自主研发AI机器人及其配套传感器。
10、微软宣布将旗下AI助手Copilot嵌入包括Word、Excel、PowerPoint、Outlook和OneNote在内的一系列Office应用程序,Microsoft 365软件套件12年来首次在美涨价。
11、Gartner警告AI对移动应用影响:AI助手将冲击移动应用,预测将导致使用量下降25%。
12、IBM与欧莱雅合作开发首个针对化妆品配方的AI基础模型,利用AI技术推动可持续美妆创新。
13、谷歌公布Titans系列AI模型架构:融合长短期记忆与注意力机制,支持超过200万个Token的上下文长度。
14、OpenAI ChatGPT搜索新动向:探索整合记忆功能,打造AI版个性化搜索体验。
15、OpenAI、软银等科技巨头宣布加入合资项目Stargate,未来四年投资5000亿美元建AI基础设施。
16、谷歌向人工智能公司Anthropic追加投资10亿美元,以增强其在人工智能领域的竞争力。
17、OpenAI阿尔特曼:ChatGPT用户可免费体验o3-mini,付费用户将获得更多额度。
18、Anthropic推出Citations API,提升AI内容来源验证准确性。
19、Adobe Premiere Pro新增AI视觉识别搜索功能:一句话快速找到视频片段。
Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的落地逻辑。
4.2 新能源产业新闻:
1、亚马逊在全球物流配送网络中已部署超过75万台机器人。
2、起亚2024年全球销量3089457辆创纪录,2025年全球销量目标定为321.62万辆。
3、韩国五大整车厂商2024年新能源汽车销量同比增长11.1%至45万辆,创历史新高。
4、大众汽车管理层集体降薪:将在2030年前总共减薪3亿欧元,董事会成员减薪幅度更大。
5、LG进军人形机器人市场,今年拟推出订阅制AI智能体用作基础模型。
6、丰田汽车将重新部署日本国内生产,以应对劳动力短缺并提高电动车产能。
7、戴姆勒卡车公司斩获其历史最大电动卡车订单:亚马逊订购超200辆纯电动重型卡车梅赛德斯-奔驰eActros 600。
4.3 传统深度学习&芯片产业新闻:
1、微软计划2025财年投资800亿美元,建设符合AI工作需求的数据中心。
2、三星推出第四代QD-OLED电视面板:峰值亮度可达4000尼特,开启显示技术新纪元。
3、高通推出新的人工智能芯片Snapdragon X,旨在为个人电脑提供强大的运算能力。
4、首款Intel 18A制程芯片亮相,英特尔Panther Lake处理器确认下半年发布。
5、亚马逊旗下AWS计划在美国佐治亚州投资约110亿美元扩大基础设施,以支持云计算和人工智能技术。
6、微软CEO纳德拉:将在印度投资30亿美元扩展Azure云计算和人工智能能力。
7、英伟达宣布将推出用于人工智能开发的台式电脑,售价3000美元。
8、LG电子与微软建立合作伙伴关系,共同推进人工智能技术在消费性电子产品中的应用。
9、亚马逊宣布其云服务部门AWS将在墨西哥投资50亿美元,预计每年创造7000个就业岗位。
10、英特尔宣布将逐渐停产第12代Alder Lake移动处理器,覆盖酷睿、奔腾及赛扬。
11、霍尼韦尔旗下量子计算公司Quantinuum宣布计划在美国新墨西哥州建立尖端研发中心。
12、亚马逊AWS宣布在印度马哈拉施特拉邦投资83亿美元,建设AI云基础设施。
4.4 互联网产业新闻:
1、三星Galaxy S25系列旗舰手机正式发布,搭载全新One UI 7系统与Galaxy AI。
2、Netflix第四财季新增订户1890万,将上调美国、加拿大、阿根廷和葡萄牙大多数套餐的价格。
4.5 商业基本面新闻:
1、全球航天2025年首次发射:SpaceX猎鹰9号成功将Thuraya 4-NGS送上天。
2、苹果公司CEO蒂姆・库克2024年薪酬达到7461万美元,同比增长约18%。
3、国际货币基金组织(IMF):亚太发达经济体的工作岗位中,约有一半受到人工智能(AI)的影响。
4、日本2024年破产企业数量达10006家,同比上升15.14%,时隔11年再次超过1万家。
5、Meta计划淘汰约5%“表现未达预期”员工,并在2025年填补这些职位。
6、微软暂停美国咨询部门新员工招聘,并进行小规模裁员削减成本。
7、亚马逊将在北美商店部门裁员约200人,涉及时尚和健身业务等领域的员工。
Rocky观点:“全球范围内的大规模人力资源的优化调整,无疑给我们更多自信。”
8、盖茨基金会公布2025年度预算为87.4亿美元,为迄今为止规模最大的年度预算。
9、联合国教科文组织:将人工智能定为2025年国际教育日主题,呼吁推动人工智能在教育领域的理性应用。
10、日产汽车据悉考虑在制造部门裁员约6700人,行政部门裁员约2300人。
【五】重点AIGC事件战略分析:DeepSeek带来的核心价值是什么?
在2025年年初,DeepSeek系列的横空出世彻底搅动的全球AIGC行业格局。
根据其公布测试数据显示,DeepSeek-R1在美国AIME 2024测试中拿下79.8分,超过了OpenAI的o1模型的79.2分;在MATH-500,R1为97.3分,同样超过了o1的96.4分;在SWE-bench Verified,R1为49.2分再次超过了o1的48.9分。
而在代码测试Codeforces中,R1仅比o1模型低0.3分;MMLU低1分;GPQA低4.2分,整体性能与o1模型相当。但价格方面o1模型每100万tokens的输入是15美元,R1是0.14美元,比GPT-4o-mini价格还要低(目前OpenAI最便宜的核心模型),整体成本猛降90%!
输出价格更是低的震惊世界,o1每100万tokens输出是60美元,R1只有2.19美元,降低了27倍左右!
好的,大家了解了DeepSeek系列的基本信息后,Rocky开始带着大家进行战略分析。
首先第一点,DeepSeek系列的持续发布并搅动整个AIGC产业格局后,修改了美国的国运。然后才是展现了中国的国运。这两个先后顺序非常关键。
因为美国几乎孤注一掷的押注了AI产业,但是到头来却发现95%的投入都被自己人欺骗和吃干抹尽了,这对美国的宏观决策者、资本、生产资料拥有者都是莫大的侮辱。AIGC的未来进入了重新评估的阶段,AIGC产业未来的想象空间依旧是无限的,但是不能让一个美国AIGC初创公司买一个椅子要花费100万美元。
第二点,从AIGC产业格局来看。我们需要客观的说,美国的AIGC势能与创新能力依旧很强,未来大概率依旧是中美两国在AIGC领域长期竞争与发展。
在这种大前提下,需要保证的是除了中美以外,不能再允许有一个国家出现AI大萌芽,其他西方落后国家和发展中国家只能成为中美两个AIGC产业链中的一环。
因为中美人口实在太多了,就算吃完全球的市场,也是不够吃的。同时两家的互相竞争是非常好的,这样才能促进AIGC领域的快速发展与持续危机感,DeepSeek的横空出世证明了哪里有卡脖子,哪里就有突破,只是时间问题而已。并且突破卡脖子带来的收益实在是太多了。
但是绝对不允许第三个国家出现AI大萌芽了,这是中美在AIGC领域竞争过程中的首要警钟。
**然后才是从AIGC技术角度来看,因为AI技术终其一生只是一个工具。这个朴素的观点也是Rocky对AIGC技术的本质判断与定论。**总的来说,DeepSeek系列表明了开源模型的能力终于和OpenAI闭源模型持平,其中DeepSeek-V3达到了GPT-4o的性能,而DeepSeek-R1则达到了OpenAI-o1正式版性能。开源模型向闭源模型发起了冲锋,开源和闭源的逻辑需要重新思考了。
接着,从技术细节角度来看,DeepSeek系列绕过了CUDA护城河,直接用更底层的PTX语言进行优化,这不仅有效的让DeepSeek大大增加了运行效率,同时还能让DeepSeek不受限制的运行在非英伟达的显示芯片上。这就是突破底层硬件壁垒的大功一件。
与此同时,未来AIGC时代大模型的训练和部署成本都将大大降低。让民用级别硬件部署完整大语言模型成为可能。未来每个人都能用少量成本就获得GPT-o1级别的个人AI助手。
最后,Rocky用一句来结束本期的重点AIGC事件战略分析:“DeepSeek系列发布后,他们会开放免费API额度,会降低订阅价格,会拿出压箱底的最新模型,会解锁高级功能。这不是因为他们突然关心用户体验,也不是因为他们萌发了开源情怀,而是因为DeepSeek一直都在。”
【六】AI产业链融资新闻
Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。
1、Anthropic洽谈新一轮融资,估值600亿美元!
华尔街日报消息,著名大模型平台Anthropic正在洽谈新一轮的20亿美元融资,估值达到600亿美元,比之前提升了3倍。
Anthropic作为OpenAI最大竞争对手之一,曾获得云计算巨头亚马逊投资的80亿美元。如果本次融资顺利,Anthropic将仅次于xAI、OpenAI成为全球融资排名第三高的大模型平台。
资料显示,Anthropic创立于2021年,总部位于美国加利福尼亚州旧金山,其核心初创人员来自OpenAI的ChatGPT开发团队。
产品方面,Anthropic的主打产品是Claude,是一种类似ChatGPT的AI聊天助手,通过文本问答方式就能生成、总结各种内容,适用法律、医疗、营销、人力资源等领域。
硬件方面,Anthropic正与亚马逊旗下的Annapurna Labs紧密合作,共同开发未来的Trainium加速器,以提升专业机器学习硬件的能力。这种深度的技术合作不仅涉及编写底层内核以实现与Trainium硅片的直接接口,还包括贡献于AWS Neuron软件栈的增强工作,旨在从硬件中提取最大计算效率,用于训练最前沿的基础模型。
Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。
【七】AI技术进展头条新闻
Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。
1、Luma发布视频模型Ray2:逼真到难以分辨,算力扩大10倍!
知名文生视频模型平台Luma AI发布全新产品Ray2。与第一代相比,Ray2在文本语义还原、自然连贯动作、运镜、光影效果、物理模拟、色彩等方面更出色,同时算力扩大了10倍生成效率更高。
使用地址:https://lumalabs.ai/ray
2、Adobe、加大推出音乐模型DITTO-2,可精准控制强度、旋律!
全球多媒体巨头Adobe、加州大学的研究人员联合推出了一款创新音乐模型DITTO-2。
DITTO-2在扩散模型的基础之上,对生成音乐的效率、控制能力,例如,音乐修复、音乐扩展、强度调整、旋律控制以及音乐结构控制等进行大幅度强化。
与传统的音乐模型相比,DITTO-2将音乐生成的效率提升了10—20倍左右,并且训练成本非常低,在A100 GPU上只训练了30多个小时。
项目地址:https://ditto-music.github.io/ditto2/
论文地址:https://arxiv.org/abs/2405.20289
3、DeepSeek-R1发布:开源版o1!中国大模型让全球震动,成本猛降90%!
之前国产大模型平台DeepSeek开源的v3模型,受到了Andrej
Karpathy等业内大神的盛赞,在算法、数据等方面非常棒。
现在,DeepSeek又重磅开源了R1模型。根据其公布测试数据显示,在美国AIME 2024测试中R1拿下79.8分,超过了OpenAI的o1模型的79.2分;在MATH-500,R1为97.3分,同样超过了o1的96.4分;在SWE-bench Verified,R1为49.2分再次超过了o1的48.9分。而在代码测试Codeforces中,R1仅比o1模型低0.3分;MMLU低1分;GPQA低4.2分,整体性能与o1模型相当。
但价格方面o1模型每100万tokens的输入是15美元,R1是0.14美元,比GPT-4o-mini价格还要低(这个是目前OpenAI最便宜的主打模型之一)成本猛降90%。
输出价格更是低的离谱,o1每100万tokens输出是60美元,R1只有2.19美元,降低了27倍左右。
开源地址:https://huggingface.co/deepseek-ai/R1
API地址:https://api-docs.deepseek.com/guides/reasoning_model
github项目地址:https://github.com/deepseek-ai/DeepSeek-R1?tab=readme-ov-file
4、OpenAI发布o3-mini,可免费使用、3大推理模式!
OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。
Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。
此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。
遗憾的是,o3-mini不支持视觉推理。
在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。
使用地址:https://openai.com/index/chatgpt/
5、阿里开源视觉AI Agent模型:Qwen2.5-VL!
与之前版本相比,在图像、文本、视频的理解、识别能力更强之外,Qwen2.5-VL最大特色就是可以直接作为一个视觉 Agent来自动化操作电脑、手机。
例如,根据我们的行程日期,自动帮我们预订飞机票。此外,Qwen2.5-VL还能理解超过1小时的长视频,并且能定位特定时间点发生的事件。例如,在安防领域,能快速定位到有人闯入、火灾发生等关键事件的视频片段,可极大节省审阅视频的时间。
开源地址:https://huggingface.co/collections/Qwen/qwen25-vl-6795ffac22b334a837c0f9a5
Github地址:https://github.com/QwenLM/Qwen2.5-VL
在线体验地址:https://chat.qwenlm.ai/
6、Sora等AI视频大模型的核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用AI视频大模型,从0到1训练自己的AI视频大模型,AI视频大模型性能测评,AI视频领域未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Sora等AI视频大模型文章地址:https://zhuanlan.zhihu.com/p/706722494
7、Stable Diffusion 3和FLUX.1核心原理,核心基础知识,网络结构,从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画,从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型,Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion 3和FLUX.1文章地址:https://zhuanlan.zhihu.com/p/684068402
8、Stable Diffusion XL核心基础知识,网络结构,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260
9、Stable Diffusion 1.x-2.x核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634
10、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1训练自己的ControlNet模型,从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126
11、LoRA系列模型核心原理,核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126
12、Transformer核心基础知识,核心网络结构,AIGC时代的Transformer新内涵,各AI领域Transformer的应用落地,Transformer未来发展趋势等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Transformer文章地址:https://zhuanlan.zhihu.com/p/709874399
13、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!
码字不易,欢迎大家多多点赞:
AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114
14、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!
码字不易,欢迎大家多多点赞:
算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303
《三年面试五年模拟》github项目地址(希望大家能多多star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer
15、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761
16、GAN网络核心基础知识,网络架构,GAN经典变体模型,经典应用场景,GAN在AIGC时代的商业应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
GAN网络文章地址:https://zhuanlan.zhihu.com/p/663157306
推荐阅读
1、加入AIGCmagic社区知识星球
AIGCmagic社区知识星球不同于市面上其他的AI知识星球,AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台,涉及AI绘画、AI视频、大模型、AI多模态、数字人以及全行业AIGC赋能等100+应用方向。星球内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AI课程、AIGC模型、AIGC数据集和源码等干货。
那该如何加入星球呢?很简单,我们只需要扫下方的二维码即可。与此同时,我们也重磅推出了知识星球2025年惊喜价:原价199元,前200名限量立减50!特惠价仅149元!(每天仅4毛钱)
时长:一年(从我们加入的时刻算起)
2、其他
《WeThinkIn老实人报》的第四十一期就完整展现在大家面前了,未来引领AI科技浪潮的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!
最后,在AIGC时代中,希望大家能和Rocky一起,飞速成长!
Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本,大家可以关注公众号WeThinkIn,并在后台 【精华干货】菜单或者回复关键词“YOLO” 进行取用。
Rocky一直在运营技术交流群(WeThinkIn-技术交流群),这个群的初心主要聚焦于技术话题的讨论与学习,包括但不限于算法,开发,竞赛,科研以及工作求职等。群里有很多人工智能行业的大牛,欢迎大家入群一起学习交流~(请添加小助手微信Jarvis8866,拉你进群~)