- 博客(5)
- 收藏
- 关注
原创 Cron表达式
Cron表达式:用于配置CronTrigger实例是有7个子表达式组成的字符串,描述了时间表的详细信息格式为[秒][分][小时][日][月][周][年]解释一下特殊字符:可以使用在线生成cron表达式的方式生成相关网址:https://cron.qqe2.com/...
2021-06-01 14:43:43 124
原创 从零开始学ai-机器学习篇 3.数据特征和预处理
数据特征和预处理1.特征处理的方法2.sklearn特征预处理API特征处理是什么?通过特定的统计方法(数学方法)将数据转换成算法要求的数据数值型数据:标准缩放1.归一化2.标准化3.缺失值类别型数据:one-hot编码时间类型:时间的切分one hot 热编码one-hot编码 - 热编码 为每个类别生成一个布尔列,这些列中只有一列可以为每个样本取值1,因此,术语一个热编码归一化使得某一个特征对最终结果不会造成更大的影响缺点:异常点对最大值最小值影响太大
2021-05-19 10:56:35 223
原创 从零开始学ai-机器学习篇 2.特征工程
特征工程本章需要使用到sklearn库,详细步骤就不说了,大家自行解决特征工程的目的目的是最大限度地从原始数据中提取特征以供算法和模型使用sklearn对特征工程API的简单解释sklearn对特征工程的封装很好,使用起来非常友善.以下是对其api的解释xx.fit_transform()将数据放入xx模型进行计算和转换xx.inverse_transform()返回转化之前的数据格式(可选array或者sparse的格式)xx.get_feature_names()返回
2021-05-17 10:10:34 202
原创 从零开始学ai-机器学习篇 1.机器学习概述
机器学习概述机器学习算法是核心,数据和计算是基础机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效一般训练集:测试集为0.75:0.25机器学习分类监督学习 输入数据有特征有标签,即有标准答案监督学习(Supervised learning)可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个
2021-05-17 09:36:23 212
原创 2021泰迪杯-数据挖掘练习1-京东热水器评论分析
本次挖掘目标 ①分析某一热水器的用户情感倾向 ②从评论文本中挖掘出该热水器的有点与不足总体流程[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qokBC3Ob-1616242440197)(https://i.loli.net/2021/03/18/ec4FQMdl7yrmY65.png)]文本挖掘相关概念:①文本挖掘文本挖掘是一个以半结构(如 WEB 网页)或者无结构(如纯文本)的自然语言文本为对象的数据挖掘,是从大规模文本数据集中发现隐藏的、重要的、新颖的
2021-03-21 04:23:07 5662 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人