- 博客(3)
- 收藏
- 关注
原创 上课代码(备用版)
对读取的文本进行预处理,将每个句子分成标题和正文两部分,去除正文中的换行符并将正文转换为列表形式。然后将每个句子拆分成长度为4的序列,前三个元素作为输入X,最后一个元素作为输出Y。最后输出一些训练数据,包括X和Y。导入NumPy和Pandas库,读取名为'poems_clean.txt'的文本文件,将其转换为Pandas数据框,并命名列名为"text"。从Keras库中导入Tokenizer模块,使用它将处理后的文本转换为序列,得到词汇表大小。输出部分数字化后的训练数据,包括原始文本、数字化后的X和Y。
2023-06-12 20:28:51 139
原创 机器学习(课上笔记)
机器学习:机器学习是一种计算机程序,它可以让系统在未经人为编辑的情况下,具有经验(数据)中自动学习并自我改进的能力ps:机器学习是人工智能的一个子分类。
2023-03-09 21:10:24 147
原创 深度学习:从入门到精通课后习题解答本答案仅供参考
(2) 从计算来看。深度学习模型算法通常是一个整体,它包含了对非结构化数据的处理(特征提取和生成),利用特征完成预测或者分类任务,而这些部分之间的协调关系是优化过程中自动调整的。深度学习处理的数据对象一般是非结构化的数据,如图像,声音,文本,甚至是它们的混杂。人的面部图像数据是X,人的性别可以作为分类变量的Y1,年龄可以作为连续性变量的Y2。高度非线性体现在,图像数据并不是像身高、体重这样的数据,可以很容易的建立传统统计学的线性回归和逻辑回归模型,他需要经过非常复杂的特征提取之后再映射到我们关心的因变量。
2023-03-09 16:24:57 3599 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人