算法应用
文章平均质量分 95
机器学习与深度学习算法应用
WGS.
道阻且长,与君共勉:你若对得起时间,时间便会对得起你。
展开
-
机器学习-常用回归算法归纳(全网之最)
文章目录前言一元线性回归多元线性回归局部加权线性回归多项式回归Lasso回归 & Ridge回归Lasso回归Ridge回归岭回归和lasso回归的区别L1正则 & L2正则弹性网络回归贝叶斯岭回归Huber回归KNNSVMSVM最大间隔支持向量 & 支持向量平面寻找最大间隔SVRCART树随机森林GBDTboosting思想AdaBoost思想提升树 & 梯度提升GBDT面试题整理XGBOOST面试题整理LightGBMXGBoost的缺点LightGBM的优化基于Hist原创 2021-10-28 18:14:11 · 21256 阅读 · 5 评论 -
使用百度AI接口进行人脸识别(Python SDK V3版本实现)
文章目录1.在百度AI开放平台创建接口2.安装人脸识别 Python SDK3.算法思路3.1首先通过python SDK中的AipFace类获取一个客户端对象3.2通过获取的客户端对象client进行操作。4.完整代码1.在百度AI开放平台创建接口https://blog.csdn.net/qq_42363032/article/details/1086529452.安装人脸识别 Python SDK首先在当前的python环境中使用pip install baidu-aip安装人脸识别 Pyth原创 2020-09-17 21:21:30 · 3905 阅读 · 0 评论 -
数据挖掘---营销推广预测响应
数据集及源码:https://download.csdn.net/download/qq_42363032/12645777文章目录预测1.读取数据2.提取X和Y3.连续型变量特征重要性筛选(相关系数)将相关系数小于0.1的删除(弱相关)筛选之后的数值型特征4.离散型变量特征筛选(方差分析)筛选之后的离散型特征5.特征重新拼接看一下连续型特征的基本统计量(EDA探索性分析)连续型变量处理对数处理看一下离散型特征的基本统计量(EDA探索性分析)离散型变量处理6.前向选择法筛选变量7.建立线性回归模型回归1.原创 2020-07-26 19:38:18 · 659 阅读 · 0 评论 -
数据挖掘---银行案例_预测违约概率
数据集及源码 https://download.csdn.net/download/qq_42363032/12643050文章目录Bank数据介绍表关系分析读取并筛选数据1.读取csv文件2.将csv文件的文件名作为Key, 内容作为value,存入到局部变量中3.对贷款表(Loans)的还款状态做词频统计还款状态映射为数值类型4.对贷款表和客户表做连接查询(因为贷款表和客户表没有直接的主外键关系,这里通过权限分配表【Disp】)来连接5.在4.表基础上,再与人口地区统计表 (District)建立连原创 2020-07-20 19:31:08 · 4679 阅读 · 3 评论 -
中文新闻分类_朴素贝叶斯底层实现
数据集https://download.csdn.net/download/qq_42363032/12630826import osimport randomimport jiebafrom sklearn.naive_bayes import MultinomialNBimport matplotlib.pyplot as plt"""函数说明:中文文本处理Parameters: folder_path - 文本存放的路径 test_size - 测试集占比,默认占所原创 2020-07-18 10:02:30 · 322 阅读 · 0 评论 -
垃圾邮件分类_朴素贝叶斯底层实现
数据集https://download.csdn.net/download/qq_42363032/12630824import reimport osimport randomimport numpy as np# 处理给定路径下的文件# 按照文件类别分别加载文件,将每个文件转换成一个单词列表,# 并最终将各个单词列表再组成一个listdef load_data(folder_path): os.chdir(folder_path) # 改变当前的工作目录 doc_原创 2020-07-18 10:01:19 · 547 阅读 · 0 评论 -
情感文本分类_朴素贝叶斯底层实现
思路小结获取数据(切分词条和类别标签)返回词汇列表,即实验样本词条去重返回词集模型(利用去重后的词汇表,讲待输入词条向量化)训练朴素贝叶斯计算先验概率(属于1的概率,这里是属于侮辱类)计算条件概率(后验概率:每个类别中某个单词出现的次数 / 每个类别所有单词数)返回属于0和1的条件概率以及该文档属于1的概率创建朴素贝叶斯分类器测试分类器import numpy as np, pandasfrom functools import reducefrom sklearn.f.原创 2020-07-18 09:59:33 · 391 阅读 · 0 评论 -
KNN实现验证码识别
源码地址:KNN算法我们主要要考虑三个重要的要素,对于固定的训练集,只要这三点确定了,算法的预测方式也就决定了。这三个最终的要素是k值的选取,距离度量的方式和分类决策规则。对于k值的选择,没有一个固定的经验,一般根据样本的分布,选择一个较小的值,可以通过交叉验证选择一个合适的k值。选择较小的k值,就相当于用较小的领域中的训练实例进行预测,训练误差会减小,只有与输入实例较近或相似的训练实例才会对预测结果起作用,与此同时带来的问题是泛化误差会增大,换句话说,K值的减小就意味着整体模型变得复杂,容易发生过拟原创 2020-07-17 21:26:20 · 786 阅读 · 0 评论 -
旅游企业客户洞察(kmeans聚类)
数据集https://download.csdn.net/download/qq_42363032/12620538先看一下表结构# |字段|含义|类型|# |:--:|:--:|# |interested_travel |旅行偏好|二分类|# |computer_owner |是否有家用电脑|二分类|# |age |估计的年龄|连续|# |home_value |房产价格|连续|# |loan_ratio|贷款比率|连续|# |risk_score |风险分数|连续|# |marita原创 2020-07-16 10:57:31 · 970 阅读 · 1 评论 -
cv2+svd分解 压缩图像
import cv2 # v:vision 视觉import numpy as npimport matplotlib.pyplot as pltplt.rcParams["font.sans-serif"] = ["SimHei"]image = cv2.imread("111.jpg")w = 264h = 266# 将原来的图像进行压缩image = cv2.resize(image, dsize=(h, w))# 调整RGB三个颜色的顺序-->BGRimage =原创 2020-07-16 10:51:51 · 542 阅读 · 0 评论 -
电子商务+seaborn画图+线性回归
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningsimport scipy.stats as sci# 加载数据集customers = pd.read_csv('Ecommerce Customers.csv')print(customers.head())打印散点图+分布图# 打印散点图+分布图# sns.jointpl原创 2020-07-14 20:17:18 · 441 阅读 · 0 评论 -
泰坦尼克数据集+seaborn画图+逻辑回归
'''Seaborn是一个用Python制作统计图形的库。它构建在matplotlib之上,并与pandas数据结构紧密集成。 以下是seaborn提供的一些功能:一个面向数据集的API,用于检查多个变量之间的关系专门支持使用分类变量来显示观察结果或汇总统计数据用于可视化单变量或双变量分布以及在数据子集之间比较它们的选项各种因变量线性回归模型的自动估计与绘图方便查看复杂数据集的总体结构用于构造多图网格的高级封装,可以轻松地构建复杂的数据图表使用几个内置主题对matplotlib图形样式进行原创 2020-07-14 20:15:27 · 1733 阅读 · 0 评论