![](https://img-blog.csdnimg.cn/20210624090419944.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
人工智能
机器学习与人工智能的应用与实用技术
__万波__
没多少天赋,但很热爱程序
展开
-
特征工程总结与示例
特征工程是指将原始数据集处理成适合机器学习数据集的过程.总结如下处理数据集的案例以便参考.准备以下10条数据, 保存为test.txtmilage,Liters,Consumtime,target40920,8.326976,0.953952,314488,7.153469,1.673904,226052,1.441871,0.805124,175136,13.147394,0.428964,138344,1.669788,0.134296,172993,10.141740,1.032955原创 2021-06-25 11:22:58 · 503 阅读 · 0 评论 -
机器学习算法:决策树
决策树算法简述我们做一系列决定时, 会根据我们最关注的点, 一步一步推想得出最终决定, 例如找女朋友的决策过程, 价值观融洽–>貌美如花–>乐观开朗–>勤劳上进–> 不顾一切地追求. 这就是一个决策树. 对于机器而言, 决定目标是否重要是根据信息熵来决定的.在计算时, 信息熵的熵减最大的目标, 就是最重要的目标. 通俗来讲, 一个目标由多种因素构成, 每中因素的有无, 对整个目标的判断影响是一个百分比, 比值越大的, 熵减越大, 它就是越重要的信息.决策树代码示例数据集链接原创 2021-06-23 23:00:10 · 106 阅读 · 0 评论 -
机器学习算法: K-means聚类算法
K-means聚类算法简述K-means聚类算法有个大前提, 就是面对一堆数据, 我们事先知道这些数据的种类数.聚类算法通过迭代计算数据与中心点的距离, 最终锁定种类中心的方式, 实现数据的分类.代码案例使用k聚类算法对用户购物篮进行分类数据集链接 提取码: n53ximport pandas as pd# 导入特征降维工具from sklearn.decomposition import PCA# 导入聚类算法估计器from sklearn.cluster import K原创 2021-06-23 22:44:03 · 476 阅读 · 0 评论 -
机器学习算法: 岭回归算法
岭回归算法简述岭回归算法的出现, 最终目标是在欠拟合与过拟合的算法中,找到的一种折中的解决方案.欠拟合的函数如y = k1x + k2x^2 + ... + knx2 , 都是低次幂的简单线性方程的组合. 而过拟合的函数如: y = k1x^2 + k2x^3 + ... + knx^n 有很多高次幂的复杂线性方程的组合. 要在两者之间找一个折中的解决方案, 就是岭回归算法. 岭回归算法会将过拟合的高次幂函数正则化, 从而得到折中的曲线.欠拟合 欠拟合是指抽取特征太少, 导致训练正确率低, 模型预判的原创 2021-06-23 20:54:00 · 1173 阅读 · 2 评论 -
python中文分词库jieba的使用
python中的中文分词库jieba非常好用首先使用pip安装扩展库: pip install jieba如果速度太慢, 可以换清华园源安装: pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba使用示例:# 安装扩展包后导入jieba库import jieba# 导入文本特征提取工具from sklearn.feature_extraction.text import CountVectorizer# 对中文进行分词原创 2021-06-23 08:10:03 · 631 阅读 · 0 评论 -
机器学习算法: 梯度下降算法
梯度下降算法简述梯度下降算法是对线性回归算法的优化. 线性回归算法遇到大量特征, 且特征复杂的情况时, 求解速度很慢, 且得不到结果. 梯度下降算法则是先设置学习率和学习方向, 逐步调整线性回归的系数. 使用梯度下降算法, 必定会得到最终的结果. 学习率的设置理论上越小, 结果越理想, 但学习率越小, 计算量越大, 所以要设置合适的学习率算法示例# 导入数据集, 波士顿房价影响因素与房价相关数据from sklearn.datasets import load_bostonfrom sklearn原创 2021-06-22 22:43:36 · 216 阅读 · 1 评论 -
机器学习算法: 线性回归算法
线性回归算法原理简述对于生活中有类似线性变化规律的事物, 我们试图总结出一条有明确规律的变化曲线, 最终利用这条变化的曲线的顾虑, 对事物将来可能的变化做出预测.主要的应用场景是股市k线走势预测, 各种商品价格波动预测算法示例根据波士顿房价影响因素历史数据, 生成线性回归模型# 导入数据集, 波士顿历史房价数据from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_spli原创 2021-06-22 22:28:18 · 177 阅读 · 0 评论 -
机器学习算法: 朴素贝叶斯算法
朴素贝叶斯算法原理简述理解朴素贝叶斯算法之前, 先应该理解什么是条件概率. 条件概率是指, 在事件A已经发生的情况下, 事件B发生的概率. 数学符号记作P(A|B). 机器学习就是利用这个原理, 对数据进行分类.分类的过程通俗来讲, 就是:我们有y1 ~ yn 共n种分类, 然后我们有待分类的数据x, 最终想确定x属于哪一个分类. 所以我们就有一种思想, 找出条件概率最大的y分类, 就知道x属于哪一类了. 既求: max{ P(x|y1) ... P(x|yn) }代码示例以下案例使用约20w篇原创 2021-06-22 22:14:01 · 149 阅读 · 0 评论 -
人工智能入门,第一个机器学习程序
人工智能–> 机器学习 --> 深度学习人工智能是指一种能够让机器像人类一样思考的技术.机器学习是实现人工智能的途径之一, 就是用大量数据, 计算出一个模型, 然后利用模型, 对未知数据进行预判.深度学习则是机器学习的领域之一, 主要是指基于图形建模,预判机器学习的流程准备原始数据.原始数据必须是100%正确的. 否则训练出来的模型准确度不够高特征工程特征工程就是将原始数据进行一系列的处理, 使其利于机器学习特征工程分为:特征抽取: 将由训练价值的数据提取原创 2021-06-22 09:15:18 · 475 阅读 · 0 评论