![](https://img-blog.csdnimg.cn/520d637ec1354151b155579881961325.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
文章平均质量分 84
机器学习基础及实战
最白の白菜
Java道路长漫漫,坚持学习最关键。
人生苦短,我用Python。
人外有人,山外有山。越努力,越幸运!
展开
-
机器学习阶段总结
机器学习阶段总结从放假到现在终于把唐宇迪老师的python数据分析与机器学习实战视频网课看完了,整体感受就是仍然感觉我还是个废物,哈哈哈哈。。学习到的确实挺多的,Python的一些库,还有很多的算法,当然也在一直坚持做笔记。我磕磕绊绊算是踏入了人工智能的大门,从机器学习打基础,一些知识点熟悉但没掌握,代码能看懂一些但又不能完全看懂。跟JAVAEE学习相比,Python学起来更像是多而杂。记得前几天就因为这个事情跟我一位交流了一下,他说Python学习前期其实都在转圆圈,等学的多了,渐渐就会向圆中心深原创 2022-02-08 12:17:03 · 1368 阅读 · 0 评论 -
Python时间序列分析与实战
Python时间序列分析与实战时间序列分析ARIMA自回归模型(AR)自回归模型的限制移动平均模型(MA)自回归移动平均模型(ARMA)ARIMA(p,d,q)模型自相关函数ACF(autocorrelation function)偏自相关函数(PACF)(partial autocorrelation function)ARIMA(p,d,q)阶数确定:ARIMA建模流程:Pandas生成时间序列Dates & Times时间序列date_rangetruncate过滤Pandas数据重采样数据重原创 2022-02-07 19:19:46 · 2616 阅读 · 0 评论 -
实战项目-python库分析科比生涯数据
python库分析科比生涯数据import numpy as np import pandas as pd import matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import KFold# import datafilename= "data.csv"raw = pd.read_csv原创 2022-02-06 16:17:50 · 2087 阅读 · 0 评论 -
scikit-learn模型建立与评估
scikit-learn模型建立与评估使用python库分析汽车油耗效率import pandas as pdimport matplotlib.pyplot as pltcolumns = ["mpg", "cylinders", "displacement", "horsepower", "weight", "acceleration", "model year", "origin", "car name"]# delim_whitespace指定数据中以空格为切割符cars = pd.re原创 2022-02-06 14:10:27 · 1877 阅读 · 2 评论 -
自然语言处理向量模型-Word2Vec
自然语言处理向量模型-Word2Vec自然语言处理与深度学习拼写检查、关键词检索…文本挖掘(产品价格、日期、时间、地点、人名、公司名)文本分类机器翻译客服系统 英语复杂对话系统深度学习的基础模型是神经网络,指定学习目标,就可以朝着学习的优化目标前进为什么需要深度学习?手工特征耗时耗力, 还不易拓展自动特征学习快, 方便拓展深度学习提供了一种通用的学习框架, 可用来表示世界、视觉和语言学信息深度学习既可以无监督学习, 也可以监督学习语言模型实例:机器翻译;拼写纠错 ;智能原创 2022-01-24 13:09:42 · 901 阅读 · 0 评论 -
Xgboost集成算法
Xgboost集成算法学完神经网络之后,感觉脑子一片浆糊,大部分听不懂的状态,休息了三四天,还得继续向下学习。。。。唉,我就是太笨了啊!xgboost介绍xgboost算法是跟决策树联系在一起的既可以做分类任务,也可以做回归任务。y^i=∑jwjxij\hat{y}_{i}=\sum_{j} w_{j} x_{i j}y^i=∑jwjxij 样本与权值的线性组合目标函数:l(yi,y^i)=(yi−y^i)2l\left(y_{i}, \hat{y}_{i}\right)=\le原创 2022-01-21 15:17:00 · 1140 阅读 · 0 评论 -
神经网络与实例
神经网络计算机视觉所面临的挑战照射角度;光照强度;形状改变;部分遮蔽;背景混入…常规套路:1.收集数据并给定标签2.训练一个分类器3.测试,评估K近邻尝试图像分类对于未知类别属性数据集中的点:1.计算已知类别数据集中的点与当前点的距离2.按照距离依次排序3.选取与当前点距离最小的K个点4.确定前K个点所在类别的出现概率5.返回前K个点出现频率最高的类别作为当前点预测分类。概述:KNN 算法本身简单有效,它是一种 lazy-learning 算法。分类器不需要使用训练集进行训练,原创 2022-01-16 17:13:42 · 612 阅读 · 0 评论 -
降维算法-主成分分析(PCA)
主成分分析(PCA)Principal Component Analysis无监督问题用途:降维中最常用的一种手段目标:提取最有价值的信息(基于方差)问题:降维后的数据的意义?向量的表示内积:(a1,a2,⋯ ,an)⊤⋅(b1,b2,⋯ ,bn)⊤=a1b1+a2b2+⋯+anbn\left(a_{1}, a_{2}, \cdots, a_{n}\right)^{\top} \cdot\left(b_{1}, b_{2}, \cdots, b_{n}\right)^{\top}=a_{1}原创 2022-01-15 16:22:22 · 445 阅读 · 0 评论 -
聚类算法与实践
聚类算法聚类概念:无监督问题:我们手里并没有每一个数据属于某一类标签了聚类:相似的东西分到一组难点:如何评估,如何调参K-MEANS算法要得到簇的个数,需要指定K值质心:均值,即向量各维取平均即可距离的度量:常用欧几里得距离和余弦相似度(先标准化)优化目标:min∑i=1K∑x∈Cidist(ci,x)2\min \sum_{i=1}^{K} \sum_{x \in C_{i}} \operatorname{dist}\left(c_{i}, x\right)^{2}min∑i=1K原创 2022-01-15 15:04:01 · 423 阅读 · 0 评论 -
支持向量机与案例-SVM调参
支持向量机Support Vector Machine要解决的问题:什么样的决策边界才是最好的呢?特征数据本身如果就很难分,怎么办呢?计算复杂度怎么样?能实际应用吗?目标:基于上述问题对SVM进行推导决策边界:选出来离雷区最远的(雷区就是边界上的点,要Large Margin)距离的计算数据标签定义数据集:(X1,Y1)(X2,Y2)… (Xn,Yn)Y为样本的类别: 当X为正例时候 Y = +1, 当X为负例时候 Y = -1决策方程: y(x)=wTΦ(x)+by(x)=w^{T原创 2022-01-14 17:02:03 · 685 阅读 · 0 评论 -
python文本数据分析-新闻分类任务
python文本数据分析-新闻分类任务文本分析文本数据停用词:1.语料中大量出现;2.没啥大用;3.留着过年嘛?所以根据停用词表进行筛选,去掉这些停用词。Tf-idf:关键词提取《中国的蜜蜂养殖》: 进行词频(Term Frequency,缩写为TF)统计出现次数最多的词是----“的”、“是”、“在”----这一类最常用的词(停用词)“中国”、“蜜蜂”、“养殖”这三个词的出现次数一样多,重要性是一样的?"中国"是很常见的词,相对而言,"蜜蜂"和"养殖"不那么常见“逆文档频率”(Inve原创 2022-01-13 18:37:06 · 1055 阅读 · 0 评论 -
贝叶斯算法与拼写检查器实例
贝叶斯算法贝叶斯简介:贝叶斯(约1701-1761) Thomas Bayes,英国数学家贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章生不逢时,死后它的作品才被世人认可贝叶斯要解决的问题:正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测为什么使用贝叶斯?现实世界本身就是不确定原创 2022-01-13 14:46:57 · 151 阅读 · 2 评论 -
集成算法-随机森林与案例实战-泰坦尼克获救预测
集成算法-随机森林Ensemble learning目的:让机器学习效果更好,单个不行,群殴走起Bagging:训练多个分类器取平均 f(x)=1/M∑m=1Mfm(x)f(x)=1 / M \sum_{m=1}^{M} f_{m}(x)f(x)=1/M∑m=1Mfm(x)Boosting:从弱学习器开始加强,通过加权来进行训练 Fm(x)=Fm−1(x)+argminh∑i=1nL(yi,Fm−1(xi)+h(xi))F_{m}(x)=F_{m-1}(x)+\operatorname{arg原创 2022-01-12 16:41:50 · 818 阅读 · 0 评论 -
项目实战-交易数据异常检测
项目实战-交易数据异常检测import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedata = pd.read_csv("creditcard.csv")data.head()# value_counts计算当前数据的某一列有多少个不同的属性值count_classes = pd.value_counts(data['Class'], sort = True).sort原创 2022-01-10 19:06:47 · 989 阅读 · 0 评论 -
逻辑回归模型案例
逻辑回归模型案例我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训例子,你有两个考试的申请人的分数和录取决定。为了做到这一点,我们将建立一个分类模型,根据考试成绩估计入学概率。# 数据分析三大件import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matpl原创 2022-01-10 13:49:03 · 1351 阅读 · 0 评论 -
线性回归算法&梯度下降策略&逻辑回归算法
线性回归算法&梯度下降策略&逻辑回归算法一个月过去了,这一个月也没有学习Python,期间准备了英语六级,感觉考的也不怎么样,之后又有课程设计,在学校事情太多了。。。。放假回家了,元旦玩了4,5天,终于可以静下心来学习了。线性回归算法机器学习的数学基础很重要,学习的过程注定有很多不理解的以及枯燥的地方,一定要坚持下去!线性回归例子:数据:工资和年龄(2个特征);目标:预测银行会贷款给我们多少钱(标签);考虑:工资和年龄都会影响最终银行贷款的结果那么它们各自有多大的影响呢?(参数)原创 2022-01-05 18:14:14 · 1016 阅读 · 0 评论 -
seaborn随笔
seaborn随笔import seaborn as snsimport numpy as npimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inline# 自定义函数的方式观察matplotlib的作图风格def sinplot(flip=1): # 在0-14的区间上取100个点 x = np.linspace(0,14,100) for i in range(1,7):原创 2021-12-03 16:15:08 · 1040 阅读 · 0 评论 -
matplotlib随笔
matplotlib随笔# 将数据进行可视化展示import pandas as pdunrate = pd.read_csv("UNRATE.csv")# 将时间的数据标准化unrate["DATE"] = pd.to_datetime(unrate["DATE"])print(unrate.head(12))import matplotlib.pyplot as pltimport numpy as np# 画图操作plt.plot()plt.show()# 下面这行让图片原创 2021-12-01 15:57:46 · 1085 阅读 · 0 评论 -
pandas随笔
pandas随笔# 数据读取import pandas as pd# 读取csv文件,如果不在当前目录,需要引入绝对路径food_info = pd.read_csv("food_info.csv")# DataFrame就相当于也是一个矩阵结构print(type(food_info))# 这里的object其实就是String类型的数据print(food_info.dtypes)# 帮助文档print(help(pd.read_csv))# 如果想用以前写的变量比如导的包,还有原创 2021-11-29 13:45:08 · 642 阅读 · 2 评论 -
numpy随笔
numpy的基础学习随笔数据组成:一般数据是由长方形表格组成,数据是由每一个样本组成,每一行表示一个样本,每一列表示当前数据的指标。numpy就是专门做矩阵计算的。 notebook的好处就是可以随时随地运行一个代码块 shift + enter快捷键运行 按住tab键自动补齐代码 半小时掌握 Jupyter Notebook常用用法:https://baijiahao.baidu.com/s?id=1685474425246208044&wfr=spider&for=pc# impor原创 2021-11-26 10:07:03 · 590 阅读 · 0 评论 -
机器学习入门&安装Anaconda
机器学习入门&安装Anaconda前言Python基础其实有Java的学习经历差不多一个星期就可以学完了,但是我用了将近两星期,算是边玩边学吧,总的来说基础就跟Java的东西差不多,无疑就是多了元组,列表和字典的一些操作和语法。后面又学习PR剪辑,算是满足的自己的临时兴趣,不过之后学习到vlog阶段要买相机什么的,学生党没钱(手动狗头),所以先缓缓学习PR,继续在学习Python的这条道路上走下去,我的学习方向是人工智能机器学习+深度学习。至于我为什么学习Python,不学Java了,因为我得紧原创 2021-11-24 21:56:27 · 1832 阅读 · 1 评论