AI目前在工业运用方面主流有3个方向:
1. 计算机视觉cv的方向
2. 自带源处理的aop方向
3. 搜广推的推荐系统方向
据ai的神经网络深度学习定义2张图片像素对比的损失函数
Content loss
OpenAi最新的大模型GPT-4o背后的原理是什么?演示效果如何牛逼背后有那些隐秘的黑科技?
flash-attention-v2 一种优化底层的技术 为什么能加速模型的训练和推理?它又有什么原理?
最前沿的混合专家模型MoE, 还停留在2023年的Mistral 8 * 7b 吗?
为什么520,字节,百度等一众大厂宣布大降价或免费?背后是商战还是技术战?DeepSeek-v2技术,这是一神作听过吗?
深度求索这家公司出的,能超越open-ai的大模型;涉及mla多头影视注意力的技术,还有共享专家的技术,非常有创造
性非常天才的ider;最近还开源了
你听说过世界语言吗?你知道在大模型训练中这个黑科技有什么作用吗?
答案是token语料,ai把互联网所有的语料都爬虫到了有上万亿之多,不管用哪个语言作为主语言学习知识,都能无缝转
接用别的语言把知识展现出来;在训练大模型的时候都会用世界语言的技巧,就是用其他语言的知识和概念来辅助和增
强这个主语言的训练
Ai有算法设计岗位 有开发应用岗位
项目二:AI最前沿 ---视频生成
编写你的文本要求,Ai会凭空生成你想要的视频
o Sora
0 GPT-40
1:视频1展示文本---knight_saber
Two knights dueling with lightsabers, cinematic action shot, extremely slowmotion.
两名骑士用光剑决斗,电影般的动作场面,极慢的慢镜头。
2:视频2展示文本--- panda_skate_air
A cute panda skateboarding in the sky, over snow covered mountains, with a dreamy and whimsical.
一只可爱的熊猫在天空中滑板,经过白雪覆盖的山脉,场面梦幻而富有想象力。
3: 视频3展示文本--- cat_van_gogh
A cat eating food out of a bowl, in the style of Van Gogh.
一只猫以梵高的艺术风格从碗里吃食物。
Dit Block 模型图
左边 Latent Diffusion TransFermer -> 影像量的扩散 右边 Dit Block with adaLN-Zero
Patchify 视频的燃料
视频生成的网络架构 Sora Encoder
Latent Space 数学矩阵运算场 <-- 变分自动编码器VQGAN <-- Visual Space 训练视频
Denoising Unet 反噪声化处理 --> Decoder 解码 --> 生成目标视频
视频风格迁移第一步设定Gram矩阵,整个神经网络的核心是Basik block模型子模块
数学矩阵 线性代数 求导 多元函数
学微积分 求多维偏导 多元函数的偏导数要会求 矩阵乘法不满足交换率 比前端加法要难有门槛
五个赛道 代数学 纯几何拓普 微分方程 卷积神经网络 百分之十才用到图论和数论