机器学习
微毂
这个作者很懒,什么都没留下…
展开
-
Python字符串处理-(NLP)
去除空格原创 2020-08-18 17:37:02 · 132 阅读 · 0 评论 -
Numpy-通用函数
绝对值absfabs—>(浮点型)print(np.abs(ar1))print(np.fabs(ar2)) [4 3 2 1 0 1 2 3]********************[[1. 2. 3.] [2. 3. 4.]]平方根print(np.sqrt(ar3))[1. 1.41421356 1.73205081 2. ...原创 2019-09-26 15:31:00 · 376 阅读 · 0 评论 -
python机器学习-模型优化(六)
在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。超参数是不直接在估计器内学习的参数。在scikit-learn包中,它们作为估计器类中构造函数的参数 进行传递。典型的例子有:用于支持向量分类器的C、kernel和gamma ,用于Lasso的alpha等。搜索超参...原创 2019-08-28 10:58:44 · 1117 阅读 · 0 评论 -
python机器学习-模型评估(五)
http://sklearn.apachecn.org/cn/0.19.0/modules/model_evaluation.html除了使用estimator的score函数简单粗略地评估模型的质量之外,在sklearn.model_selection模块中的交叉验证相关方法可以评估模型的泛化能力,能够有效避免过拟合。6.1、metrics评估sklearn.metrics中的评估模型指...原创 2019-08-28 10:42:13 · 1283 阅读 · 0 评论 -
python机器学习-建模(四)
5.1、线性回归5.2、逻辑回归from sklearn.linear_model import LogisticRegressionfrom sklearn.cross_validation import cross_val_predict# 自定义权重项penalty = { 0: 5, 1: 1}lr = LogisticRegression(class_...原创 2019-08-28 09:41:57 · 1970 阅读 · 0 评论 -
python机器学习-特征工程(三)
https://www.cnblogs.com/jasonfreak/p/5448385.html三、特征提取字典加载特征:DictVectorizer文本特征提取:词频向量(CountVectorizer)TF-IDF向量(TfidfVectorizer,FfidfTransformer) 特征哈希向量(HashingVectorizer)图像特征的提取:提取像素矩阵边缘和兴趣点3...原创 2019-08-26 14:53:56 · 1331 阅读 · 0 评论 -
Python机器学习-数据预处理(二)
http://sklearn.apachecn.org/cn/0.19.0/modules/preprocessing.html#preprocessing保证特征之间的差异一样2.1、缺失值处理统计缺失值的个数null_counts = loans.isnull().sum()删除整个记录里任何一个变量有缺失值的记录一般不建议使用dropna=titanic_df.dropna(...原创 2019-07-31 15:34:27 · 710 阅读 · 0 评论 -
Python-pandas进阶篇
1、读取数据data=DataFrame(np.arange(16).reshape(4,4),index=['BJ','SH','GZ','SZ'],columns=['one','two','three','four'])data---------------------------- one two three fourBJ 0 1 2 3SH 4 5 6 7...原创 2019-07-24 15:00:46 · 295 阅读 · 0 评论 -
Python-pandas入门篇
数据读取数据预处理原创 2019-07-18 10:55:05 · 108 阅读 · 0 评论 -
Python机器学习-数据观察(一)
不管是数据分析还是机器学习,拿到一份数据前应该先了解数据的背景,了解业务需求,再者就是查看数据了。1.1、数据的读取# 读取数据,读取压缩的格式df = pd.read_csv("redcard.csv.gz", compression='gzip')1.2、查看数据# 查看数据大小df.shapedf.head()# 查看数据信息df.info()# 数据的分布规则df...原创 2019-07-31 14:22:29 · 1311 阅读 · 2 评论