![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习和深度学习
外出的霍比特人
有文艺情怀的理工男
展开
-
用TensorFlow搭建卷积神经网络识别数字0~9
入门深度学习,用TensorFlow搭建卷积神经网络识别数字0~9,采用mnist数据集,参考了其它两三篇博客的内容。一些相关内容我写在代码注释里面了:import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras import layers, optimizers, datasets# 下面一行是在线加载方式获取mnist数据# mnist = tf.keras.datasets.mnist# 下面两行是加载原创 2020-11-27 23:41:16 · 1042 阅读 · 0 评论 -
sklearn特征预处理:归一化和标准化
sklearn特征预处理:归一化和标准化特征预处理:通过一些转换函数,将特征数据转换成更加适合算法模型的特征数据。API:sklearn.preprocessing数值型数据的无量纲化:1、归一化:x_new = (x - min)/(max - min),如果将其映射到指定的区间(a,b),则:x_new_new = x_new * (b-a) + a,一般是映射到(0,1),则:x_new_new = x_new。归一化的缺点:如果数据中有异常值(最大值和最小值),影响比较大,鲁棒性比较差。2原创 2020-11-17 16:30:19 · 787 阅读 · 0 评论 -
sklearn文本特征提取和TfidfVectorizer
sklearn文本特征提取和TfidfVectorizer文本特征提取:单词作为特征。**关键词:**在某一个类别的文章中,出现的次数很多,在其它的文章中出现的次数很少。具有很好的类别区分能力,适合用来分类。**sklearn.feature_extraction.text.CountVectorizer():**统计每个样本特征值出现的次数。**注意:**英文文本中不统计字母,中文文本中不统计单个字,标点符号也不统计。注意:在统计文本里面单词出现次数的时候,单词或者词语需要用空格键隔开,英文文本已原创 2020-11-15 16:14:47 · 315 阅读 · 0 评论