机器学习算法基础1(数据集,特征抽取,归一化,标准化,缺失值处理)
目录1.数据集的组成1.1可用数据集1.2常用数据集结构组成2.特征工程2.1特征抽取2.1.1sklearn 特征抽取API2.1.2文本特征抽取中文问题 2.2 文本特征常用方法tf-idf分析问题(NLP不用这个用更新的方法)3特征预处理3.1 标准缩放归一化3.1.1sklearn归一化API: 3.1.2归一化案例 3.2 标准缩放 标准化(使用较多) 3.2.1.sklearn特征化API:3.3 标准缩放 缺失值处理 机器学习的数据:文件csvpandas:读取工具numpy:释放了GIL 实
复制链接