自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 datawhale学习 异常检测1

1 什么是异常检测异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。识别如信用卡欺诈,工业生产异常,网络流里的异常(网络侵入)等问题,针对的是少数的事件。1.1 异常的类别点异常(point anomalies)指的是少数个体实例是异常的,大多数个体实例是正常的,例如正常人与病人的健康指标;条件异常(conditional anomalies),又称上下文异常,指的是在特定情境下个体实例是异常的,在其他情境下都是正常的,例如在特定时间下的温度突

2021-05-11 23:08:33 118

原创 2020-09-12

网页附件爬虫下载并基于NLP贴关键字网页爬虫获取附件文档格式转换NLP中文jieba分词TF-IDF关键词提取爬虫上传原网址

2020-09-12 02:10:57 80

原创 nlp新闻分类学习-赛题理解

赛题数据集形式:为防止侵权等信息,使用的是匿名加密过后的新闻数据,新闻数据种类包括财经,彩票,时政,股票,家居,教育等13类,每个数据用特定的数字组合代替。一共有200000数据集,两个测试集共有5000条数据,测试集的新闻种类已经注明,数据读取建议采用pandas进行调用,主要的工作包括特征提取,和分类。1.特征提取使用tf+idf进行特诊提取,tf是评价新闻类内部的字段特征值,idf是评价类组件之间的特征提取。从各个新闻中提取特征,特征值代表这条新闻的某条属性。2.分类模型现有成熟的分类模型有

2020-07-21 21:38:59 188

转载 MySQL:MySQL和SQL Server的区别

MySQL:MySQL和SQL Server的区别导读:接下来的网上商城的项目,需要用到MySQL数据库了。这个对于我来说,是一个新接触的东西,按照惯例,在刚开始学习一个东西的时候,先从宏观上去了解它。本篇博客,先介绍SQL Server的基本内容,然后介绍MySQL的基本内容,最后介绍两者之间的区别。一、SQL Server基本简介1.1,概述SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行Microsoft

2020-06-04 10:42:39 176

原创 CV街景字符识别 最后一水 TASK5

下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\CV_DataSet\mc.

2020-06-02 16:57:22 109

原创 CV学习task 4 最后一水

下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\CV_DataSet\mc.

2020-05-30 19:42:47 201

原创 CV学习 TASK3 接着水

下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\CV_DataSet\mc.

2020-05-26 23:11:54 161 1

原创 2020-05-23

task 2 数据读取与数据扩增下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。#导包import pandas as pdimport osimport requestsimport zipfile #路径中不要有中文links = pd.read_csv(‘D:\DataWhale - CVimagedetect\C

2020-05-23 10:28:10 218

原创 Datawhale 零基础入门CV赛事-Task1 赛题理解

1. 下载测试数据集通过pandas os,requests模块从指定连接中下载数据流,下载对象是压缩包故还需引入zipfile处理。导入数据过程中需注意:所有文件路径中不要有中文;循环存储方式使用 iter_content()方法。# 导包import pandas as pdimport osimport requestsimport zipfile#路径中不要有中文links = pd.read_csv('D:\DataWhale - CVimagedetect\CV_Da

2020-05-20 21:31:01 220 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除