![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 77
yxyibb
文艺程序媛
展开
-
AI-应试-机器学习公式推导与代码实现-预备
欠拟合:继续学过拟合:把噪声也学到了训练误差正则化(惩罚项)正则化参数的同时最小化经验误差泛化能力:最大程度拟合训练数据,对未知测试数据有好的泛化能力方法:数据采集、特征工程、算法调优。原创 2023-05-08 00:16:47 · 348 阅读 · 1 评论 -
数据挖掘-(心跳信号分类预测)-task2
数据挖掘-(心跳信号分类预测)-task2基础点分析数据,了解数据集结构变量间的相互关系以及变量与预测值之间的存在关系数据处理+特征工程数据探索分析知识点1 了解数据方法:载入各类库:数据科学库pandas,numpy,scipy可视化库matplotlib,seabon载入数据:train、test观察数据结构(head()+shape)数据总览:describe() 数据相关统计量info()熟悉数据类型判断数据缺失、异常每列nan情况异常原创 2021-03-20 00:29:12 · 199 阅读 · 0 评论 -
EnsembleLearning机器学习基础-task2
EnsembleLearning机器学习基础-task2基础点1项目流程明确类型:分类、回归收集数据集并选择合适的特征选择度量模型性能的指标选择模型,训练,优化评估性能,调参2回归项目演示选择回归项目选用sklearn的boston房价数据集,特征:from sklearn import datasetsboston = datasets.load_boston()X = boston.datay = boston.targetfeatures = boston.fea原创 2021-03-19 00:27:43 · 92 阅读 · 0 评论 -
EnsembleLearning机器学习基础-task1
EnsembleLearning机器学习基础-task1基础点分类回归无监督学习知识点机器学习,分为有监督学习和无监督学习无监督学习:有特征,没有因变量,学习数据本身的结构和关系。有监督学习:有特征,给定因变量,缩小预测值与因变量差有监督学习,分为回归和分类分类:因变量离散回归:因变量连续常用学习库:scikit-learn,常用包:import numpy as npimport pandas as pdimport matplotlib.pyplot as plt原创 2021-03-17 21:55:09 · 133 阅读 · 1 评论 -
数据挖掘-(心跳信号分类预测)-task1
EnsembleLearning机器学习基础-task1基础点分类回归无监督学习知识点机器学习,分为有监督学习和无监督学习无监督学习:有特征,没有因变量,学习数据本身的结构和关系。有监督学习:有特征,给定因变量,缩小预测值与因变量差有监督学习,分为回归和分类分类:因变量离散回归:因变量连续常用学习库:scikit-learn,常用包:import numpy as npimport pandas as pdimport matplotlib.pyplot as plt原创 2021-03-16 00:30:16 · 268 阅读 · 0 评论 -
数据分析-(学术前沿趋势分析)-task5
数据分析-(学术前沿趋势分析)-task5分析作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系。(主要目标数据,作者‘author’)构建图关系,挖掘作者关系知识点拿到数据集,先看下特征量,找到与论文类别相关的特征(作者‘author’);提取出来处理成常用人名格式’;用pandas看下数据结构(展示前几行,有个大致轮廓);论文第一作者与其他作者构建图;使用图算法,统计图中作者与其他作者联系;Graph是用点和线来刻画离散事物集合中的每对事物间以某种方式相联系的数原创 2021-01-23 23:47:30 · 278 阅读 · 3 评论 -
数据分析-(学术前沿趋势分析)-task4
数据分析-(学术前沿趋势分析)-task4分析论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类。(主要目标数据,论文‘title’,‘abstract’)知识点拿到数据集,先看下特征量,找到与论文类别相关的特征(论文‘title’,‘abstract’);提取出来(dict)拼成‘text’用pandas看下数据结构(展示前几行,有个大致轮廓);注意,有多个类别、类别有子类别时,需要提前处理一下;类别是多个,所以需要多编码文本分类的典型方法!!!TF-IDF+机器学习分类原创 2021-01-18 17:40:25 · 212 阅读 · 0 评论