自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Asia-Lee的博客

咨询交流请加群:955817470,GitHub:https://github.com/Asia-Lee

  • 博客(124)
  • 资源 (15)
  • 论坛 (1)
  • 收藏
  • 关注

原创 图像处理基础操作三

一、图像直方图1、直方图灰度直方图(histogram)是灰度级的函数,描述的是图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。横坐标是灰度级,纵坐标是灰度级出现的频率。直方图是对图像的中的像素点的值进行统计,一般情况下直方图都是灰度图像,直方图x轴是灰度值(一般0~255),y轴就是图像中每一个灰度级对应的像素点的个数,即横坐标表示图像中各个像素点的灰度级,纵坐标表示具有该灰度级的像素个数。matplotlib绘制直方图#encoding:utf-8import cv2

2020-11-10 11:26:19 136

原创 图像处理基础操作二

一、边缘检测边缘检测通常是在保留原有图像属性的情况下,对图像数据规模进行缩减,提取图像边缘轮廓的处理方式。边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数通常对噪声很敏感,因此需要采用滤波器来过滤噪声,并调用图像增强或阈值化算法进行处理,最后再进行边缘检测。1、Roberts算子Roberts算子又称为交叉微分算法,它是基于交叉差分的梯度算法,通过局部差分计算检测边缘线条。常用来处理具有陡峭的低噪声图像,当图像边缘接近于正45度或负45度时,该算法处理效果更理想。其缺点是对边缘的定位不太准

2020-11-09 10:01:35 320

原创 图像处理基础操作一

一、图像基础图像处理:对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很少涉及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压缩,图像恢复,二值图像处理等等。基于阈值的图像分割也属于图像处理的范畴。一般处理的是单幅图像。图像分析:对图像的内容进行分析,提取有意义的特征,以便于后续的处理。处理的仍然是单幅图像。计算机视觉:对图像分析得到的特征进行分析,提取场景的语义表示,让计算机具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像,当然也包括部分单幅图像。图像都是由像素

2020-11-06 16:23:09 413

原创 基于Flask进行接口开发及测试

一、环境准备1、FlaskFlask 是一个微型的 Python 开发的 Web 框架,基于WerkzeugWSGI工具箱和Jinja2模板引擎。 Flask使用BSD授权。 Flask也被称为“microframework”,因为它使用简单的核心,用extension增加其他功能。Flask没有默认使用的数据库、窗体验证工具。然而,Flask保留了扩增的弹性,可以用Flask-extension加入这些功能:ORM、窗体验证工具、文件上传、各种开放式身份验证技术。Flask学习参考:Fla..

2020-10-27 15:21:19 170

原创 Docker及K8s常用命令使用总结

目录一、docekr常用命令总结二、k8s常用命令总结三、nvidia-smi常用命令总结一、docekr常用命令总结1、镜像的查看与删除查看镜像:docker images 或 docke image ls 删除容器:docker rm 容器ID //注意删除容器前先停止容器 删除镜像:docker rmi 镜像名 //注意删除镜像前先删除容器2、容器的启动与进入运行容器:docker run -it 镜像名 /bin/b...

2020-10-26 17:23:49 164

原创 基于Darknet的YOLOv4目标检测

一、基于Windows的YOLOv4目标检测1、环境配置环境准备:Win10、CUDA10.1、cuDNN7.65、Visual Studio 2019、OpenCV 3.4(1)Visual Studio2019企业版安装(2)NVIDIA驱动下载与安装(3)下载并安装CUDA10.1,下载安装cuDNN7.65对于cudnn直接将其解开压缩包,然后需要将bin,include,lib中的文件复制粘贴到cuda的文件夹下,比如:C:\Program Files\NVIDIA GPU

2020-09-14 21:43:03 1848 5

原创 2020算法笔试题总结

题目一:找出符合条件的字符串组合1、题目描述某公司经理希望在圣诞节期间通过出售组合装来提高公司商品的销售量。组合装里有不同种类的商品,以不同顺序排列。每个商品都有唯一的characterID。而每个组合装也有唯一的comboID,由组合装中各种商品的排列顺序表示。组合装的comboID是通过将组合装中商品的characterID按其在组合装中的排列顺序形成的。例如,如果购买了ID为a、a、...

2020-06-19 14:49:41 1503 3

原创 Python3读取和写入excel表格数据

目录一、python读取excel表格数据1、读取excel表格数据常用操作2、xlrd模块的主要操作3、读取单元格内容为日期时间的方式4、 读取合并单元格的数据二、python写入excel表格数据1、写入excel表格数据常用操作和格式设置2、字体颜色和背景颜色对应索引号python操作excel主要用到xlrd和 xlwt 这两个库,xlrd读取exc...

2020-04-13 21:04:15 14784 8

原创 PyTorch图像分类

目录一、torch和torchvision1、torchvision.datasets2、torchvision.models3、torchvision.transforms4、torchvision.utils二、MNIST手写数字识别1、获取MNIST训练集和测试集2、数据装载3、数据预览4、构建卷积神经网络模型5、对模型进行训练和参数优化6、对...

2020-01-15 11:50:58 2964

原创 PyTorch基础学习总结

目录一、PyTorch中的Tensor张量1、Tensor张量2、Tensor数据类型3、Tensor常用函数二、基于PyTorch搭建简易神经网络模型1、简易神经网络模型2、Pytorch自动梯度3、使用自动梯度和自定义函数搭建简易神经网络模型三、torch.nn和torch.optim1、使用torch.nn搭建神经网络模型2、使用torch.opt...

2020-01-14 21:38:12 1127

原创 Linux环境下的C++编程基础

目录一、工具准备二、程序的编译及调试1、程序的编译及常用命令2、gdb调试三、Makefile文件基础1、Makefile介绍2、Makefile编写3、make的运行和退出一、工具准备gcc是GNU的C编译器(GNU C Compiler)g++是GNU的C++编译器(GNU C++ Compiler)gdb是Linux下常用的调试工具,主要功能如...

2019-12-07 22:21:16 806 1

原创 C++正则表达式regex库使用方法总结

目录一、regex库中常用组件介绍二、regex库中常用组件使用1、regex库组件使用准备2、regex_match使用3、regex_search使用4、regex_replace使用5、sregex_iterator使用三、基于regex库组件构建自己的正则接口类1、C++正则表达式接口类设计2、C++正则表达式接口类使用四、部分语法规则介绍正...

2019-12-07 22:09:44 2975 1

原创 Linux系统编程——基础命令总结

目录一、Linux常用命令1、常用工具2、目录和文件命令3、安装和卸载软件命令4、压缩包管理5、文件属性、用户用户组及查找与检索命令6、网络管理命令7、其他命令二、Linux vi/vim常用命令三、Linux下软件源更新失败问题解决一、Linux常用命令1、常用工具(1)Xshell:XShell是一个模块化模拟器,因为它提供了许多下拉选项卡。...

2019-12-03 21:47:18 19988 24

原创 Python3网络爬虫——(5)Scrapy爬虫基础

目录1、Scrapy常用命令行2、Scrapy爬取内容3、Scrapy数据提取4、Scrapy爬取中国大陆明星5、12306火车站站名爬取1、Scrapy常用命令行 scrapy startproject QuotesSpider #创建项目 scrapy crawl XX #运行XX蜘蛛 sc...

2019-11-27 21:49:02 995 3

原创 Bert文本分类(基于keras-bert实现)

目录一、Bert 预训练模型准备二、Bert 模型文本分类1、数据准备2、代码实现3、分类过程与结果一、Bert 预训练模型准备中文预训练模型下载 当Bert遇上Keras:这可能是Bert最简单的打开姿势 keras-bert不同模型的性能对比如下(可根据自己的数据选择合适的模型,模型越大需要训练的时间越长)模型 开发集 测试集...

2019-10-27 17:53:59 12135 39

原创 中文句法分析及LTP使用

目录一、中文句法分析内容概述二、基于Python的LTP句法分析1、LTP基础2、pyltp安装3、pyltp实现句法分析三、基于C++的LTP句法分析1、LTP源码和模型2、LTP的C++源码编译及测试3、在Linux下使用动态库生成可执行程序4、 构建基于LTP的句法分析类Parsing5、使用Parsing类实现句法分析四、LTP标注集参考...

2019-10-24 08:59:30 6866 1

原创 Linux环境下编译TensorFlow C++ API和测试方法总结(完美版)

目录前言1、软件下载2、不同平台版本对应要求3、环境配置4、配置TensorFlow安装选项5、使用bazel进行编译生成动态库6、编译其他依赖7、测试一:简单测试编译好的TensorFlow C++ API8、测试二:Tensorflow C++ API调用Python预训练模型前言TensorFlow C++ API的编译是线上使用TensorFlo...

2019-09-20 19:58:21 7213 7

原创 NLP词向量和句向量方法总结及实现

目录一、Word2Vec1、Word2Vec介绍2、Gensim实现Word2Vec3、基于Word2Vec的句向量4、基于加权Word2Vec的句向量5、基于Word2Vec的文本向量化实现二、GloVe1、GloVe介绍2、基于源码的GloVe词向量生成(Linux下实现)3、Gensim加载GloVe训练的词向量三、Doc2Vec1、Doc2V...

2019-08-29 22:33:02 9392 6

原创 基于树模型的lightGBM文本分类

目录1、基于TF的关键词提取2、根据词频将文本转化为向量3、基于树模型的重要特征选择5、完整代码实现6、分类结果1、基于TF的关键词提取使用TF词频对训练集clean_data_train进行关键词提取,选取topK个关键词作为特征词,即topK=10000。# 训练集中词频统计,并计算TF值def words_tf(): train_data = pd...

2019-08-28 21:42:42 1933 1

原创 算法岗面试知识点总结

目录一、机器学习知识点二、深度学习知识点一、机器学习知识点1、交叉熵公式,逻辑回归(LR)公式,逻辑回归损失函数,SVM的损失函数2、逻辑回归(LR)和线性回归的区别线性回归用来做预测,LR用来做分类;线性回归是来拟合函数,LR是来预测函数;线性回归用最小二乘法来计算参数,LR用最大似然估计来计算参数;线性回归更容易受到异常值的影响,而LR对异常值有较好的稳定性。3、支...

2019-08-05 21:10:10 1659 3

原创 字符串自动校对——2019字节跳动笔试题目

字符串自动校对(修正拼写错误字符串)题目描述:(1)三个同样的字母连在一起,一定是拼写错误,去掉一个就好了,比如:helllo->hello;(2)两对一样的字母(AABB型)连在一起,一定是拼写错误,去掉第二对的一个字母就好了:比如:helloo->hello;(3)上面的规则优先“从左到右匹配”,即如果是AABBCC,虽然AABB和BBCC都是错误拼写,应该优先考虑修复AABB...

2019-08-04 20:04:28 4350

原创 NLP句子相似性方法总结及实现

目录1、基于Word2Vec的余弦相似度2、TextRank算法中的句子相似性3、莱文斯坦距离(编辑距离)4、莱文斯坦比5、汉明距离6、Jaro距离(Jaro Distance)7、Jaro-Winkler距离(Jaro-WinklerDistance)8、基于Doc2Vec的句子相似度计算1、基于Word2Vec的余弦相似度首先对句子分词,使用Gensi...

2019-07-31 22:57:37 3223

原创 NLP关键词提取方法总结及实现

目录一、关键词提取概述二、TF-IDF关键词提取算法及实现三、TextRank关键词提取算法实现四、LDA主题模型关键词提取算法及实现五、Word2Vec词聚类的关键词提取算法及实现六、信息增益关键词提取算法及实现七、互信息关键词提取算法及实现八、卡方检验关键词提取算法及实现九、基于树模型的关键词提取算法及实现十、总结一、关键词提取概述关键词是能够表...

2019-07-23 21:09:41 19707

原创 TextRank算法介绍及实现

目录1、PageRank算法2、TextRank算法(1)关键词抽取(keyword extraction)(2)关键短语抽取(keyphrase extration)(3)关键句抽取(sentence extraction)3、TextRank算法实现(1)基于Textrank4zh的TextRank算法实现(2)基于jieba的TextRank算法实现(3)...

2019-07-22 21:57:51 6207

原创 NLP数据增强方法总结及实现

目录1、数据增强2、简单数据增强(Easy Data Augmentation,EDA)(1)EDA方法(2)EDA工具使用方法(3)EDA相关工具3、回译4、基于上下文的数据增强方法5、数据增强的作用1、数据增强数据增强是扩充数据样本规模的一种有效地方法,数据的规模越大、质量越高越好,模型才能够有着更好的泛化能力。2、简单数据增强(Easy Data ...

2019-07-16 21:19:00 5883 1

原创 XGBoost与LightGBM文本分类

目录用户评论情感极性判别一、数据准备二、数据预处理三、文本特征提取四、将数据转换为DMatrix类型五、构建XGBoost模型1、XGBoost模型主要参数(1)通用参数(2)Booster参数(3)学习目标参数2、XGBoost模型(1)基于XGBoost原生接口的分类(2)基于Scikit-learn接口的分类六、使用XGBoost做预测...

2019-07-06 13:00:56 3645 2

原创 中文自然语言预处理总结

目录中文文本预处理总结1、文本数据准备2、全角与半角的转化3、文本中大写数字转化为小写数字4、文本中大写字母转化为小写字母5、文本中的表情符号去除(只保留中英文和数字)6、去除文本中所有的字符(只保留中文)7、中文文本分词8、繁体中文与简体中文转换9、中文文本停用词过滤10、将清洗后的数据写入CSV文件中文文本预处理总结1、文本数据准备(1)...

2019-06-29 22:26:15 2086

原创 Python3对多股票的投资组合进行分析

目录概述:一、股票数据准备1、股票选择2、获取每支股票的收盘价3、计算股票的日收益率二、投资组合的收益计算1、给定权重的投资组合2、等权重的投资组合3、市值加权的投资组合三、投资组合的相关性分析1、投资组合的相关矩阵2、投资组合的协方差矩阵3、投资组合的标准差四、探索股票的最优投资组合1、使用蒙特卡洛模拟Markowitz模型2、投资...

2019-04-21 10:45:27 16437 10

原创 LSTM对股票的收益进行预测(Keras实现)

目录一、概述:二、股票数据准备三、股票数据预处理1、数据特征归一化(标准化)2、将数据集转化为有监督学习问题四、股票数据划分为训练集和测试集五、模型构建及其预测1、搭建LSTM模型并绘制损失图2、预测并反转数据(反归一化)3、绘制模型预测结果图六、模型评估一、概述:传统的线性模型难以解决多变量或多输入问题,而神经网络如LSTM则擅长于处理多个变量...

2019-04-19 10:45:22 17714 23

原创 Python3对股票的收益和风险进行分析

目录一、股票收益率1、股票的日收益率(1)计算股票的日收益率(2)绘制股票的日收益率的时间序列图(3)日收益率均值计算(4)日收益率的数据分布(5)累计日收益率计算2、股票的平均年化收益率二、股票的风险性衡量1、极差、四分位差、平均差、方差、标准差和离散系数计算2、偏度3、峰度(1)峰度的计算(2)峰度与正态分布的绘图比较4、日收益率分布...

2019-04-19 10:41:55 5030 1

原创 Python3对股票数据进行分析

目录一、量化交易概述1、量化交易(投资方法)2、算法交易(自动交易、黑盒交易或机器交易)3、量化策略4、量化选股5、股票回测二、股票数据三、股票数据分析1、导入股票时间序列数据2、绘制股票成交量的时间序列图3、绘制股票收盘价和成交量的时间序列图3、绘制K线图(蜡烛图)(1)K线图理论(2)K线图绘制4、股票指标相关性分析(1)相关关系...

2019-04-19 10:40:17 25828 12

原创 《剑指Offer》——树(Python3 实现)

目录二叉树1、重建二叉树2、树的子结构3、二叉树的镜像4、从上往下打印二叉树5、二叉树中和为某一值的路径6、二叉树的深度7、二叉树的下一个结点8、对称的二叉树9、把二叉树打印成多行10、按之字形顺序打印二叉树11、序列化二叉树12、平衡二叉树13、二叉搜索树的后序遍历14、二叉搜索树与双向链表15、二叉搜索树的第k个结点二叉树...

2019-04-08 19:56:04 571 1

原创 《剑指Offer》——数组(Python3 实现)

目录数组1、二维数组中的查找2、旋转数组的最小数字3、调整数组顺序使奇数位于偶数前面4、数组中出现次数超过一半的数字5、连续子数组的最大和6、把数组排成最小的数变形:把数组排成最大的数。7、数字在排序数组中出现的次数8、数组中只出现一次的数字9、数组中重复的数字10、构建乘积数组数组1、二维数组中的查找问题:在一个二维数组中,每一行都按照...

2019-04-02 15:13:37 538

原创 《剑指Offer》——栈和队列(Python3 实现)

目录栈和队列1、用两个栈实现队列2、栈的压入弹出序列栈和队列1、用两个栈实现队列问题:用两个栈实现一个队列,完成队列的Push和Pop操作。队列中的元素为int类型。思路:使用两个栈stack,stack1用来进栈,stack2是为了出栈时让stack1的所有元素先pop到stack2中,这样方便让队列的最顶端元素最先出来,即从stack2中pop出的第一个元素;pop...

2019-04-01 18:42:30 399

原创 《剑指Offer》——链表(Python3 实现)

目录链表1、从尾到头打印链表2、链表中倒数第K个结点3、反转链表4、合并两个排序的链表5、复杂链表的复制6、两个链表的第一个公共结点7、链表中环的入口点8、删除链表中重复的结点链表1、从尾到头打印链表问题:输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。思路:直接遍历一遍链表保存结果到list中,再返回倒序的list即可。#...

2019-04-01 10:41:28 1042

原创 TextCNN文本分类(keras实现)

目录前言:一、论文笔记二、Keras文本预处理1、读取数据集2、将文字转换成数字特征3、将每条文本转换为数字列表4、将每条文本设置为相同长度5、将每个词编码转换为词向量6、Keras文本预处理代码实现三、基于keras的TextCNN模型的构建、训练与测试1、基础版CNN(模仿LeNet-5)2、简单版TextCNN3、使用Word2Vec词向量...

2019-03-26 19:23:46 38039 45

原创 NLP常见语言模型总结

目录一、词的离散表示1、One-hot编码(独热编码)2、Bag of Words(BOW,词袋模型)3、N-gram语言模型二、词的分布式表示(Distributed Representation)1、共现矩阵(Co-currence Matrix)2、神经网络语言模型(Neural Network Language Model,NNLM)3、Word2Vec,G...

2019-01-19 10:35:19 4093

原创 英文文本分类——电影评论情感判别

目录1、导入所需的库2、用Pandas读入训练数据3、构建停用词列表数据4、对数据做预处理5、将清洗的数据添加到DataFrame里6、计算训练集中每条评论数据的向量7、构建随机森林分类器并训练8、读取测试数据并进行预测9、将预测结果写入csv文件1、导入所需的库import osimport reimport numpy as npimport...

2019-01-15 18:12:21 3072 7

原创 中文文本分类——商品评论情感判别

目录1、数据集下载2、载入数据,做预处理(分词),切分训练集与测试集3、计算训练集和测试集每条评论数据的向量并存入文件4、获得训练集向量和标签,测试集向量和标签5、训练SVM模型6、构建待遇测句子的向量7、对单个句子进行情感判断1、数据集下载商品(书籍、酒店、计算机、牛奶、手机、热水器)等评论数据from sklearn.model_selection i...

2019-01-14 21:08:51 3446 15

原创 NLTK使用方法总结

目录1. NLTK安装与功能描述2. NLTK词频统计(Frequency)3. NLTK去除停用词(stopwords)4. NLTK分句和分词(tokenize)5. NLTK词干提取 (Stemming)6. NLTK词形还原(Lemmatization)7.NLTK词性标注(POS Tag)8. NLTK中的wordnetNLTK(natural...

2019-01-07 15:06:55 7629

截止到2020全国飞机场名字和火车站名字汇总.7z

截止到2020全国飞机场名字和火车站名字汇总

2020-01-10

gdb调试技巧总结.7z

GDB是一个由GNU开源组织发布的、UNIX/LINUX操作系统下的、基于命令行的、功能强大的程序调试工具。可以用来调试C,C++程序。GDB调试技巧总结

2019-12-16

linux-cmd.zh.zip

linux基础命令;

2019-12-02

pyltp_wheel安装包.7z

哈工大自然语言处理ltp在windows10下的安装使用,两个文件针对不同的python版本下载一个即可pyltp-0.2.1-cp35-cp35m-win_amd64.whl和pyltp-0.2.1-cp36-cp36m-win_amd64.whl

2019-11-27

libtensorflow_so.7z

Linux环境下编译TensorFlow C++ API生成的动态链接库:libtensorflow_cc.so,libtensorflow_framework.so。

2019-09-24

Linux环境下编译的TensorFlow C++ API动态库文件

Linux环境下编译TensorFlow C++ API生成的 libtensorflow_cc.so 和 libtensorflow_framework.so 动态库文件

2019-09-19

社交网络影响力最大化数据集.zip

该数据集是社交网络影响力最大化数据集,使用该数据集能更好地做相关实验!

2019-07-25

IEEE Access 论文模板下载

IEEE Access 论文模板下载 IEEE Access 论文模板包括word模板和Latex模板下载

2019-01-09

UNSW_NB15入侵检测数据集

UNSW_NB15入侵检测数据集,相比于KDD99和NSL KDD数据集更适合相关研究人员用于入侵检测系统的研究

2018-11-20

CNNVD中国信息完全漏洞数据库(2002-2017年漏洞数据集)

1.CNNVD是中国国家信息安全漏洞数据库 2.软件漏洞数据包括2002年-2017年的漏洞数据 3.漏洞数据存储格式为xml,供软件安全研究人员使用

2018-10-12

漏洞数据库NVD(National Vulnerability Database)2000-2017年漏洞数据

1.NVD是美国国家通用漏洞数据库 2.漏洞数据包括2000年-2017年的漏洞数据(总共5万多条漏洞,23个漏洞类型) 3漏洞数据存储格式为xml,供软件安全研究人员使用。

2018-10-12

NASA MDP 软件缺陷预测数据集

1、NASA MDP 数据集是软件缺陷预测使用的数据集; 2、该数据集是向官方索取的,包含13个数据集文件,用于实验研究; 3、数据集文件格式是arff格式。

2018-08-30

NSL-KDD数据集

NSL-KDD数据集是KDD99数据集的改进,可以作为有效地基准数据集,各机器学习算法可以在NSL-KDD数据集上进行入侵检测实验。

2018-07-06

CNN卷积神经网络实现Mnist手写数字识别数据集

1、Mnist_cnn.py 该脚本文件 用TensorFlow框架 实现CNN卷积神经网络处理Mnist手写数字识别数据集,准确率达到99.21%; 2、Mnist_cnn_tensorboard.py 该脚本文件在Mnist_cnn.py的基础上实现可视化。

2018-05-26

Python 实现 Linear_Threshold 线性阈值模型算法

1、Python 实现社交网络影响力最大化 Linear_Threshold(线性阈值模型)算法。 2、对线性阈值模型算法进行优化改进,实现贪心算法。 3、代码中有详细注释说明,测试代码,测试节点数据集,并对数据集进行处理,输出测试结果。 4、代码实现环境:Python2.7, Anoconda2,Pycharm2017。

2018-05-21

Asia-Lee的留言板

发表于 2020-01-02 最后回复 2020-06-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除