基本framework 数据正则化的部分 机器学习对于数据是比较敏感的,为了归一化单位忽略这个单位的问题 前两种是比较常见的,后两种偶尔会用,最后一种因为房价的变化比较大,可以用log函数,log之后的加减就是原始数据的乘除。 机器学习看不了那么多的视频,只能看短的。 词根化:所有差不多的词的共同的那一段 语法化:可以跟原词不一样,但是语法上是等价的 词源化