![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数模美赛
文章平均质量分 67
林生时见lu
本人大一计科新生一枚
展开
-
python bug分析
ValueError: Classification metrics can‘t handle a mix of binary and continuous targets问题分析源代码import numpy as npimport matplotlib.pyplot as plt#%%import pandas as pdfrom sklearn.preprocessing import LabelEncoder,OneHotEncoderfrom sklearn.compose imp原创 2022-02-08 22:47:17 · 230 阅读 · 0 评论 -
美赛python学习d15--人工神经网络ANN
神经元输入信号:X1,X2,...XmX_1,X_2,...X_mX1,X2,...Xm权重:W1,W2,...WmW_1,W_2,...W_mW1,W2,...Wm也是神经网络训练的对象激活函数:φφφ隐藏神经元:激活函数读取神经元所有输入的和,再将其转化成输出阈值函数sigmoid函数线性整流函数ReLU双曲正切函数神经网络如何训练损失函数:实际值与预测值的欧式距离正向传播:根据权重预测输出值反向更新:根据损失函数调节每个权重梯度下降随机梯度原创 2022-02-08 21:30:37 · 1278 阅读 · 0 评论 -
美赛python学习d14--自然语言处理nlp
自然语言处理的应用文本的分类,文本的翻译实例根据用户的评价和是否喜欢某商品训练模型,根据新用户的评价判断是否喜欢某商品文本的清理:将所有评论看成一个稀疏矩阵,行数代表评论的个数,列数代表不同单词的个数,矩阵某行某列的元素代表在当前这条评论中当前列单词的个数清楚所有的标点符号和数字:标点符号对用户对某商品的好恶相关性很低,对于模型是噪声大小写转换清理虚词:实际...原创 2022-02-06 11:41:13 · 1654 阅读 · 0 评论 -
美赛python学习d13——K_means聚类算法
K-Means算法的作用基于数据间距离的远近,将若干离散的数据分成多个类聚类遇到的问题分成多少个类?手肘法则:畸变程度之和:通俗地说就是每个类内的数据与类耳朵中心点的距离平方和,再将所有的组内平方和相加聚合系数折线图:随着类的个数增加,聚合系数(畸变程度之和)减少,总折线图像人的手肘一样,找到最像肘部的点,确定为最终的分类个数每一类包括哪些元素算法的步骤选择类的个数K选择K个随机点作为中心点(不一定要在原数据集中)对于数据集中的每一个点,找到与其最近的中心点,作为这个中心点的类原创 2022-02-04 11:26:32 · 1577 阅读 · 0 评论 -
美赛python学习d12——机器学习分类算法的性能评价和选择
伪阳性和伪阴性伪阳性:实际上没做,预测做了,又叫一型错误伪阴性:实际上做了,预测没做,又叫二型错误二型错误一般比一型错误更严重,比如染上了传染病检测成没染上混淆矩阵横轴:实际的分类纵轴:预测的分类对角线上的数据个数代表正确的预测个数准确率悖论预测出来的准确率还没有全部预测成1(0)这种极端情况的准确率来得高累计准确曲线CAPe.g用模型制定一个产品推销给哪些人的策略,横轴代表推荐的人,纵轴代表推荐成功购买的人,最终只有10%的人购买,最好的模型在一开始就抓住了那10%的人原创 2022-02-02 21:12:18 · 1420 阅读 · 0 评论 -
美赛python学习d11——决策树,随机森林
Decision TreesClassification Trees几种常用的决策树ID3:由增熵原理决定C4.5:ID3用训练集的数据进行细小分割,这对新的数据没有意义,还会造成过拟合(overfitting)的问题,C4.5中增加了信息增益率,降低了过拟合的概率CART:用GINI指数决定如何分裂,但也存在过拟合的问题实例import numpy as npimport matplotlib.pyplot as pltimport pandas as pddataset = p原创 2022-02-01 17:23:31 · 583 阅读 · 0 评论 -
美赛python学习d10机器学习——分类算法
朴素贝叶斯算法贝叶斯定理用朴素贝叶斯算法进行分类e.g:已知用户开车(步行)上班随薪水和年龄的分布,预测一个新用户是开车还是步行上班步骤:求已知新用户特征,其步行上班的概率求先验概率:用户步行上班的概率求特征概率:在新用户周围画一个圈,圈内的用户的年龄与薪水和新用户很相近,用圈内的老用户数除以总的老用户数,代表新用户特征(年龄和薪水)的概率求条件的似然(已知用户是步行上班,求其满足新用户特征的概率):利用同样的方式计算已知新用户特征,其开车上班的概率比较两个后验概原创 2022-02-01 12:12:02 · 244 阅读 · 0 评论 -
美赛python学习d9机器学习--分类
分类逻辑回归因变量的值是一种二分类数据, 一般用0和1来表示sigmoid函数原创 2022-02-01 11:12:00 · 747 阅读 · 0 评论 -
美赛python学习d8--机器学习二:回归
回归简单线性回归数据预处理利用sklearn.linear_model中的LinearRegression类运用类创建regressor回归器对象利用训练集拟合回归器,也即是机器“学习”的过程利用拟合好的回归器预测测试集将结果可视化简单线性回归代码import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.impute import SimpleImputer as Impute原创 2022-01-26 23:44:31 · 1033 阅读 · 0 评论 -
美赛python学习d7--机器学习一:数据预处理
机器学习的概述监督学习已知的样本都有其标签。对于数据集中的每个样本,我们用算法预测出“正确答案”回归问题:预测一个连续值输出分类问题:预测一个离散值输出无监督学习数据没有标签,根据数据的特征将其分类,也是聚类算法数据预处理DataProcessinge.g任务目标:通过下列数据预测某人会不会购买商品数据集常见的问题缺失数据——解决方法:用当前列的平均值代替缺失的数据分类数据——将不同类别的非数字数据转化为数字数据,使得其可以用方程表示出来将文本数据转化为数字数据时遇到的问题:文本原创 2022-01-25 23:12:47 · 2137 阅读 · 0 评论 -
美赛python学习d5--线性规划
线性规划线性规划的目的确定多变量线性函数在变量满足线性约束条件下的最优值线性规划模型需要确定的三个要素决策变量目标函数:决策者希望对其优化的指标,是决策变量的线性函数约束条件:决策变量取值的限制范围线性规划的一般模型...原创 2022-01-15 23:26:04 · 1116 阅读 · 0 评论 -
美赛python学习d6--插值与拟合
插值插值的目的给定一系列数据点,但对于x的其他值对应的函数值是未知的,希望通过有限个数据点得到函数的解析表达式找到的近似函数需要简单便于研究利用python实现插值问题Scipy.interpolate模块有一维插值函数interp1d,二维插值函数interp2d,多维插值函数interpn,interpndinterp1d的基本调用格式为interp1d(x,y,kind=“linear”),返回一个插值函数kind的取值是字符串,指明插值方法拟合最小二乘拟合:已知一组二维数据,即原创 2022-01-15 22:55:45 · 863 阅读 · 0 评论 -
美赛python学习d4--python在高等数学和线性代数中的应用
科学计算设计数值计算和符号计算,在python中作基础数值计算用numpy和scipy工具库,作符号运算用sympy工具库sympy工具库–符号运算符号运算基本知识利用symbols函数创建符号变量构造多个符号变量时中间以空格分隔利用符号变量创建表达式利用符号表达式的subs方法计算表达式的符号值,利用evalf或n方法获得任何对象的浮点近似值sympy处理有理数的合并,化简together函数计算有理数的加法apart函数计算有理数的除法上述together函原创 2022-01-13 12:14:34 · 520 阅读 · 0 评论 -
美赛python学习d3--数据处理与可视化
文件操作数据处理工具pandaspandas的序列与数据框1. 序列Series序列由两列构成,可以由列表,元组,数组,字典构造得到,可以自己命名索引index2. 数据框DataFrame相当于是二维表格,可以自己命名索引外部文件的存取基于pandas库实现文本文件和Excel文件的读取read_csv函数读取txt或csv文件...原创 2022-01-11 12:42:43 · 654 阅读 · 0 评论 -
美赛python学习d1--基础知识
基本数据类型整形,浮点型布尔型字符型:单引号,双引号和三引号,三引号可以保留字符串的格式如换行基本数据处理变量赋值m=n=10;a,b,c=80,60,20;输入输出print格式化输出input输入的永远是字符串,需要通过int 或float函数进行类型转换运算符和表达式...原创 2022-01-02 23:11:26 · 581 阅读 · 0 评论 -
美赛python学习d2--数据处理与可视化
数值计算工具numpy数组的创建利用array函数创建一维和二维数组arange函数arange(start,stop,step,dtype) :在[start,stop)区间内创建均匀间隔的值,返回数组对象linspace函数linspace(start,stop,num,dtype) :在[start,stop]区间内创建均匀间隔的值,共num个,返回数组对象empty,zeros,ones函数empty/zeros/ones([m,n])创建m*n的空/全0/全1数组...原创 2022-01-06 22:41:57 · 1079 阅读 · 0 评论