Machine Learning
文章平均质量分 92
wendyponcho
这个作者很懒,什么都没留下…
展开
-
DS Wannabe之5-AM Project: Measuring accuracy of classification model DS 30day int prep day24 (第一季完结)
想象一下,如果我们的祖母给我们发了一封非常友善的电子邮件告诉我们她烤了饼干,而我们的过滤器将其删除,那么我们会感到多么的悲伤!因此,在垃圾邮件模型中,假阳性远比假阴性更糟糕。换句话说,哪个更糟糕:将一个健康的患者错误地诊断为患病,还是将一个患病的患者错误地诊断为健康?假设当我们将一个患者诊断为健康时,我们会让他们回家休息而不给予治疗,当我们将一个患者诊断为患病时,我们会让他们接受更多的检测。然而,错误地诊断一个患病的人意味着一个患病的人将得不到治疗,他们的病情可能会恶化,并且可能会传染给其他许多人。原创 2024-02-25 13:35:25 · 948 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day22
同前一章,讲的太专业没啥用的感觉原创 2024-02-19 08:14:16 · 728 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day21
今天没怎么好好看,感觉内容不是很有用原创 2024-02-19 08:04:32 · 734 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day20
Pix2Pix的核心是一个条件对抗网络,其中生成器尝试创建真实的图像,而判别器尝试区分真实的图像和生成器创建的图像。每个问题都涉及一个给定的情境,并提供了四个可能的后续情况,其中只有一个是合理的。与word2vec类似,它将单词对表示为向量,但不同之处在于pair2vec专注于学习词对之间的语义和语法关系的嵌入,例如("Paris", "France")和("Berlin", "Germany")之间的关系。生成器的任务是生成尽可能接近真实数据的新数据,而判别器的任务是区分生成的数据和真实数据。原创 2024-02-18 07:57:06 · 1051 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day19
Example:潜在语义索引(Latent Semantic Indexing,简称LSI)是一种自然语言处理和信息检索技术,用于发现文本数据集中的潜在语义结构。LSI通过奇异值分解(Singular Value Decomposition,SVD)这种数学方法,将高维的词-文档矩阵降维到较低维的语义空间中,以揭示词语和文档之间的隐含关系。原创 2024-02-17 08:08:52 · 690 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day18
NLP系统不仅能够处理文本中的基本语言学问题,如拼写和同音异字,还能深入挖掘文本的句法结构和丰富的语义信息,包括理解句子的组成、识别文本的主题和潜在语义关系,以及准确地处理词汇的多义性。这种综合性的系统在机器翻译、自动摘要、问答系统、情感分析等多个NLP应用领域都有着广泛的应用前景原创 2024-02-16 06:25:29 · 601 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day17
ULMFit(Universal Language Model Fine-tuning for Text Classification,通用语言模型微调用于文本分类)是一种转移学习方法,专门应用于自然语言处理(NLP)领域。在2018年5月,Jeremy Howard和Sebastian Ruder发布了一篇论文,介绍了ULMFit,并探讨了在文本分类任务中使用预训练模型的好处。原创 2024-02-15 07:06:53 · 748 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day16
各种nova + test原创 2024-02-14 06:40:17 · 795 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day14
skipping day14's content bcos i dont find them very impt原创 2024-02-14 06:22:07 · 418 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day13
time-series analysis tools原创 2024-02-12 07:38:32 · 653 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day12
然而,测试误差开始下降后会在某一点开始再次上升,这是因为模型变得过于复杂,以至于开始学习到训练数据中的噪声,而不仅仅是潜在的模式。特征提取是将原始数据转换或压缩成新的特征集(可能减少了特征的维度),这些新的特征是原始特征的变换或组合,可能会改变原始特征的含义。在图的中间部分,训练误差和测试误差之间的差距最小,这通常是模型复杂度的“最佳点”,即模型既不过于简单也不过于复杂,能够很好地泛化到未见数据。F1分数是精确率和召回率的调和平均值,用于衡量模型的准确性和召回能力的平衡性,特别适用于类别不平衡的情况。原创 2024-02-12 07:02:46 · 784 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day9
OutOfCore学习指的是在数据集太大而无法完全存储在计算机主内存(RAM)中时,用于处理数据的技术和算法。与模型参数不同,模型参数是在训练过程中从数据中学习得到的(如神经网络中的权重),而超参数是在学习过程之前设置的,并且对模型的行为和性能有重大影响。然而,它也可能是计算密集型和耗时的,特别是对于具有大量超参数或复杂搜索空间的模型。:常见的超参数示例包括梯度下降中的学习率、神经网络中的隐藏层和神经元数量、回归模型中的正则化项,以及随机森林等集成模型中的树的数量或树的深度。原创 2024-02-10 17:12:58 · 968 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day8
可以看眼之前上aml的课件原创 2024-02-07 07:21:56 · 772 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day6
今天的学习主题主要集中在深度学习和自然语言处理(NLP)的高级概念上。原创 2024-02-03 07:09:27 · 697 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day5
今天的学习主题涵盖了深度学习和机器学习中的一些关键概念,包括神经网络中的Dropout技术、迁移学习、VGG16和ResNet模型的架构、以及YOLO(You Only Look Once)物体检测算法。每个主题都围绕着如何提高模型性能、解决过拟合问题以及如何有效地处理图像识别和物体检测任务进行讨论。这些概念和技术对于理解和应用当前的深度学习模型至关重要。原创 2024-02-02 07:19:56 · 763 阅读 · 0 评论 -
DS Wannabe之5-AM Project: DS 30day int prep day4
这章内容略微杂乱。基础和dl的东西都有些。原创 2024-02-01 19:34:56 · 876 阅读 · 1 评论 -
DS Wannabe Prep学习笔记: 5. Technical Interview: Coding (Part1)
一道模拟ds coding面试题原创 2024-01-28 09:36:20 · 820 阅读 · 0 评论 -
DS Wannabe Prep学习笔记: Machine Learning Algo 1
为面试准备的【Machine Learning Interviews by Susan Shu Chang】的学习笔记从第三章的ml algo部分开始。原创 2024-01-23 15:14:26 · 895 阅读 · 1 评论