![](https://img-blog.csdnimg.cn/20210624090419944.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
人工智能
机器学习与人工智能的应用与实用技术
__万波__
没多少天赋,但很热爱程序
展开
-
特征工程总结与示例
特征工程是指将原始数据集处理成适合机器学习数据集的过程.总结如下处理数据集的案例以便参考. 准备以下10条数据, 保存为test.txt milage,Liters,Consumtime,target 40920,8.326976,0.953952,3 14488,7.153469,1.673904,2 26052,1.441871,0.805124,1 75136,13.147394,0.428964,1 38344,1.669788,0.134296,1 72993,10.141740,1.032955原创 2021-06-25 11:22:58 · 500 阅读 · 0 评论 -
机器学习算法:决策树
决策树算法简述 我们做一系列决定时, 会根据我们最关注的点, 一步一步推想得出最终决定, 例如找女朋友的决策过程, 价值观融洽–>貌美如花–>乐观开朗–>勤劳上进–> 不顾一切地追求. 这就是一个决策树. 对于机器而言, 决定目标是否重要是根据信息熵来决定的.在计算时, 信息熵的熵减最大的目标, 就是最重要的目标. 通俗来讲, 一个目标由多种因素构成, 每中因素的有无, 对整个目标的判断影响是一个百分比, 比值越大的, 熵减越大, 它就是越重要的信息. 决策树代码示例 数据集链接原创 2021-06-23 23:00:10 · 104 阅读 · 0 评论 -
机器学习算法: K-means聚类算法
K-means聚类算法简述 K-means聚类算法有个大前提, 就是面对一堆数据, 我们事先知道这些数据的种类数. 聚类算法通过迭代计算数据与中心点的距离, 最终锁定种类中心的方式, 实现数据的分类. 代码案例 使用k聚类算法对用户购物篮进行分类 数据集链接 提取码: n53x import pandas as pd # 导入特征降维工具 from sklearn.decomposition import PCA # 导入聚类算法估计器 from sklearn.cluster import K原创 2021-06-23 22:44:03 · 474 阅读 · 0 评论 -
机器学习算法: 岭回归算法
岭回归算法简述 岭回归算法的出现, 最终目标是在欠拟合与过拟合的算法中,找到的一种折中的解决方案.欠拟合的函数如y = k1x + k2x^2 + ... + knx2 , 都是低次幂的简单线性方程的组合. 而过拟合的函数如: y = k1x^2 + k2x^3 + ... + knx^n 有很多高次幂的复杂线性方程的组合. 要在两者之间找一个折中的解决方案, 就是岭回归算法. 岭回归算法会将过拟合的高次幂函数正则化, 从而得到折中的曲线. 欠拟合 欠拟合是指抽取特征太少, 导致训练正确率低, 模型预判的原创 2021-06-23 20:54:00 · 1170 阅读 · 2 评论 -
python中文分词库jieba的使用
python中的中文分词库jieba非常好用 首先使用pip安装扩展库: pip install jieba 如果速度太慢, 可以换清华园源安装: pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba 使用示例: # 安装扩展包后导入jieba库 import jieba # 导入文本特征提取工具 from sklearn.feature_extraction.text import CountVectorizer # 对中文进行分词原创 2021-06-23 08:10:03 · 627 阅读 · 0 评论 -
机器学习算法: 梯度下降算法
梯度下降算法简述 梯度下降算法是对线性回归算法的优化. 线性回归算法遇到大量特征, 且特征复杂的情况时, 求解速度很慢, 且得不到结果. 梯度下降算法则是先设置学习率和学习方向, 逐步调整线性回归的系数. 使用梯度下降算法, 必定会得到最终的结果. 学习率的设置理论上越小, 结果越理想, 但学习率越小, 计算量越大, 所以要设置合适的学习率 算法示例 # 导入数据集, 波士顿房价影响因素与房价相关数据 from sklearn.datasets import load_boston from sklearn原创 2021-06-22 22:43:36 · 215 阅读 · 1 评论 -
机器学习算法: 线性回归算法
线性回归算法原理简述 对于生活中有类似线性变化规律的事物, 我们试图总结出一条有明确规律的变化曲线, 最终利用这条变化的曲线的顾虑, 对事物将来可能的变化做出预测. 主要的应用场景是股市k线走势预测, 各种商品价格波动预测 算法示例 根据波士顿房价影响因素历史数据, 生成线性回归模型 # 导入数据集, 波士顿历史房价数据 from sklearn.datasets import load_boston from sklearn.model_selection import train_test_spli原创 2021-06-22 22:28:18 · 175 阅读 · 0 评论 -
机器学习算法: 朴素贝叶斯算法
朴素贝叶斯算法原理简述 理解朴素贝叶斯算法之前, 先应该理解什么是条件概率. 条件概率是指, 在事件A已经发生的情况下, 事件B发生的概率. 数学符号记作P(A|B). 机器学习就是利用这个原理, 对数据进行分类. 分类的过程通俗来讲, 就是: 我们有y1 ~ yn 共n种分类, 然后我们有待分类的数据x, 最终想确定x属于哪一个分类. 所以我们就有一种思想, 找出条件概率最大的y分类, 就知道x属于哪一类了. 既求: max{ P(x|y1) ... P(x|yn) } 代码示例 以下案例使用约20w篇原创 2021-06-22 22:14:01 · 145 阅读 · 0 评论 -
人工智能入门,第一个机器学习程序
人工智能–> 机器学习 --> 深度学习 人工智能是指一种能够让机器像人类一样思考的技术. 机器学习是实现人工智能的途径之一, 就是用大量数据, 计算出一个模型, 然后利用模型, 对未知数据进行预判. 深度学习则是机器学习的领域之一, 主要是指基于图形建模,预判 机器学习的流程 准备原始数据. 原始数据必须是100%正确的. 否则训练出来的模型准确度不够高 特征工程 特征工程就是将原始数据进行一系列的处理, 使其利于机器学习 特征工程分为: 特征抽取: 将由训练价值的数据提取原创 2021-06-22 09:15:18 · 473 阅读 · 0 评论