- 博客(9)
- 收藏
- 关注
原创 datawhale学习 异常检测1
1 什么是异常检测异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。识别如信用卡欺诈,工业生产异常,网络流里的异常(网络侵入)等问题,针对的是少数的事件。1.1 异常的类别点异常(point anomalies)指的是少数个体实例是异常的,大多数个体实例是正常的,例如正常人与病人的健康指标;条件异常(conditional anomalies),又称上下文异常,指的是在特定情境下个体实例是异常的,在其他情境下都是正常的,例如在特定时间下的温度突
2021-05-11 23:08:33 158
原创 2020-09-12
网页附件爬虫下载并基于NLP贴关键字网页爬虫获取附件文档格式转换NLP中文jieba分词TF-IDF关键词提取爬虫上传原网址
2020-09-12 02:10:57 119
原创 nlp新闻分类学习-赛题理解
赛题数据集形式:为防止侵权等信息,使用的是匿名加密过后的新闻数据,新闻数据种类包括财经,彩票,时政,股票,家居,教育等13类,每个数据用特定的数字组合代替。一共有200000数据集,两个测试集共有5000条数据,测试集的新闻种类已经注明,数据读取建议采用pandas进行调用,主要的工作包括特征提取,和分类。1.特征提取使用tf+idf进行特诊提取,tf是评价新闻类内部的字段特征值,idf是评价类组件之间的特征提取。从各个新闻中提取特征,特征值代表这条新闻的某条属性。2.分类模型现有成熟的分类模型有
2020-07-21 21:38:59 227
转载 MySQL:MySQL和SQL Server的区别
MySQL:MySQL和SQL Server的区别导读:接下来的网上商城的项目,需要用到MySQL数据库了。这个对于我来说,是一个新接触的东西,按照惯例,在刚开始学习一个东西的时候,先从宏观上去了解它。本篇博客,先介绍SQL Server的基本内容,然后介绍MySQL的基本内容,最后介绍两者之间的区别。一、SQL Server基本简介1.1,概述SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行Microsoft
2020-06-04 10:42:39 222
原创 CV街景字符识别 最后一水 TASK5
下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\CV_DataSet\mc.
2020-06-02 16:57:22 152
原创 CV学习task 4 最后一水
下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\CV_DataSet\mc.
2020-05-30 19:42:47 245
原创 CV学习 TASK3 接着水
下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\CV_DataSet\mc.
2020-05-26 23:11:54 208 1
原创 2020-05-23
task 2 数据读取与数据扩增下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。#导包import pandas as pdimport osimport requestsimport zipfile #路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\C
2020-05-23 10:28:10 250
原创 Datawhale 零基础入门CV赛事-Task1 赛题理解
1. 下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。# 导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv('D:\DataWhale - CVimagedetect\CV_Da
2020-05-20 21:31:01 286 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人