![](https://img-blog.csdnimg.cn/20200725195440419.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
文章平均质量分 72
机器学习
优惠券已抵扣
余额抵扣
还需支付
¥49.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
大数据AI笔记
一只认真写博客的菜鸟
展开
-
关于ISI、SCI、EI、IEEE、Elsevier、Springer的理解
1、关于会议组织者、出版商、科研工作者的关系会议组织者:可能是某个学校;也可能是某个组织;他们为学术/经济利益举办会议,从科研工作者处收文章,收注册费;然后将论文集扔给出版商;出版商:具备一定声望,比如Elsevier/IEEE/Springer,他们旗下有一些会议论文的项目,比如Elsevier的Procedia(新推出的),IEEE的Conference Program,Springer的Lecture Notes系列;这些会议项目的共同特点是:1.拿论文的版权;2.向会议组织者收取出版费用(转载 2021-07-28 14:50:07 · 1489 阅读 · 0 评论 -
整理 | 计算机听觉领域可以考虑发哪些期刊会议
主要基于同行评议,并参考CCF列表、SCI、EI、SSCI、C刊、中文核心等文章目录音频类可投稿期刊会议(领域关联度:最重要)(一)CCF列表(二)非CCF列表但同行认可人工智能类可投稿期刊会议(领域关联度:较重要)中文相关可投稿期刊会议(领域关联度:较重要)音频类可投稿期刊会议(领域关联度:最重要)(一)CCF列表IEEE/ACM Transactions on Audio, Speech, andLanguage Processing(TASLP,CCF-B类期刊,SCI)IEEE Inter原创 2021-07-26 16:09:03 · 741 阅读 · 1 评论 -
如何发表一篇计算机领域的顶会论文
文章目录背景什么是顶会期刊/会议简介写作经验分享投稿与修改阶段回复修改意见背景最近半个月,对之前发表的一篇顶会论文进行了修改,并重新提交了。这篇论文是一篇计算机领域的A会文章。本篇文章主要对计算机领域论文写作及发表过程中的相关经验做一个总结。希望可以对研究生小白们有点用。刚刚进入研究生阶段的同学,对论文的级别,例如:什么A类、B类、C类了,什么顶会了;期刊又分一堆类别,可能开始对这些概念都很混乱,也不知道那些好,哪些不好。下面先祭出CCF对期刊、会议的官方分类!又需要的小伙伴,可以直接在这个网页中找自转载 2021-06-18 14:32:59 · 5311 阅读 · 1 评论 -
2019 google开发者大会 | tensorflow相关视频
google 在今年9月10日的开发者大会上和tensorflow相关的演讲都在这里了文章目录1、机器学习简介 【25min】2、TensorFlow 主旨演讲:机器学习的现在和未来 【20min】3、TensorFlow 2.0 资讯全覆盖 【23min】4、应用 tf.text 搭建模型 【10min】5、TensorFlow Lite - 面向移动和物联网设备 【24min】6、Smile...原创 2019-09-26 17:38:27 · 578 阅读 · 0 评论 -
TensorFlow 技术框架解析 | 图文理解深度学习技术实现
最近项目需要,客户想上tensorflow,想把项目做的高大上一点,向我咨询tensorflow的相关问题和部署方案,我要假装自己很懂TF,之前一直在跟进tensorflow的技术进展,最近又做了很多功课,整理出以下内容,用这个ppt给客户讲解并加上TF的demo和tensorboard的可视化演示,客户十分满意,说这就是他们想看到的。先来认识一下TF的价值:TensorFlow...原创 2018-02-08 11:34:03 · 15258 阅读 · 2 评论 -
深度学习平台:Tensorflow 环境搭建 | linux操作系统
1. SSH登录远程服务器ssh 用户名@IP地址2. Annoconda安装下载地址bash Anaconda-2.1.0-Linux-x86_64.sh安装完成之后要重启终端,anaconda才能生效 删除anaconda:rm -rf ~/anaconda3. 建立一个tensorflow的运行环境conda create -n...原创 2018-01-11 10:33:05 · 2860 阅读 · 2 评论 -
深度学习框架TensorFlow入门,tensorflow python 实操 。
代码import osimport tensorflow as tfimport numpy as npos.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'# 测试数据准备train_X = np.linspace(-1, 1, 100)train_Y = 2 * train_X + np.random.randn(*train_X.shape)...原创 2017-12-13 21:42:13 · 1548 阅读 · 0 评论 -
基于bert的中文实体关系识别(实体关系抽取)项目开源
在清华大学开源的OpenNRE项目基础上实现中文实体关系识别github项目地址,点我文章目录一、中文关系抽取训练结果测试结果二、使用前准备三、注意事项一、中文关系抽取使用哈工大,BERT-wwm,中文bert,在20w中文人物关系数据上的准确率达到0.97训练结果=== Epoch 0 train ===100%|███████████████████████████████...原创 2019-12-11 17:23:33 · 13312 阅读 · 6 评论 -
从零开始装kenlm,cmake安装、boost和zlib安装、训练语言模型、压缩模型
一、安装步骤首先给出官网的安装步骤:wget -O - https://kheafield.com/code/kenlm.tar.gz |tar xzmkdir kenlm/buildcd kenlm/buildcmake ..make -j2二、cmake安装执行到第四步cmake ..,报错没有cmake,安装cmake:安装cmake参考(无坑):https://bl...原创 2019-04-24 21:52:49 · 1901 阅读 · 3 评论 -
文本分类方向的一点探索 | 解读自然语言处理技术之文本向量和词向量
我们身边每天所产生的信息量正在迅猛增加,而这些信息基本都是非结构化的海量文本。 人类可以轻松处理与感知非结构化文本,但机器显然很难理解。 不用说,这些文本定然是信息和知识的一个宝贵来源。因此,设计出能有效处理各类应用中非结构化文本的方法就显得便迫在眉睫。文本挖掘这么厉害,他到底能为企业带来什么价值呢,下面我举一个实际的例子来说明。 大家猜一猜这幅图的业务背景是什么?它能说明什么问...原创 2018-05-30 23:12:12 · 2662 阅读 · 4 评论 -
Python 中文 文本分析 实战:jieba分词+自定义词典补充+停用词词库补充+词频统计
最近项目需要,实现文本的词频分析,折腾了几天才完成任务,有点成就感,最后整理总结一下这部分的内容,希望更多同僚受益。使用方法环境:Python3.6安装结巴:pip install jiaba下载停用词词典哈工大停用词词典构建补充词典userdict,后文详解运行文章最后面的完整代码先来认识jieba参考简介“结巴”中文分词:做最好的Python中...原创 2018-04-28 13:47:31 · 35639 阅读 · 18 评论 -
手把手教你制作 中英文 词云 | python demo
以前做词云的时候网上看的python做词云的坑都很多,耗了很多时间才高清楚wordcloud制作词云的精髓和脉络,整理如下。1.词云生成wordcloud包的基本用法class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_hori...原创 2018-02-08 11:13:07 · 11058 阅读 · 5 评论 -
大数据人工智能行业技术图谱
目录大数据工程师必备技能架构师技能图谱运维工程师必备技能前端工程师必备技能CTO技能图谱程序开发语言综述机器学习技能图谱大数据工程师必备技能架构师技能图谱运维工程师必备技能前端工程师必备技能CTO技能图谱程序开发语言综述机器学习技能图谱...原创 2018-02-08 11:12:31 · 5063 阅读 · 0 评论 -
一图看懂人工智能技术体系
整理了一下人工智能技术体系原创 2017-12-15 13:21:40 · 5806 阅读 · 0 评论 -
python 算法面试代码
快排一行代码实现quick_sort = lambda array: array if len(array) <= 1 else quick_sort([item for item in array[1:] if item <= array[0]]) + [array[0]] + quick_sort([item for item in array[1:] if item > array[0]])符合python风格的快排代码def quick_sort(arr): """原创 2021-01-12 18:12:51 · 523 阅读 · 1 评论 -
全连接神经网络实现多分类 | 磁条卡风控 python demo
去年跑的调研小demo。# -*- coding: utf-8 -*-&amp;amp;quot;&amp;amp;quot;&amp;amp;quot;Created on Wed May 08:40:21 2017@author: 陶瑞全连接网络&amp;amp;quot;&amp;amp;quot;&amp;amp;quot;# 以输入为5个unit 中间为5 输出为原创 2018-09-29 16:24:49 · 1272 阅读 · 1 评论 -
基金净值预测 建模方案 | 大数据+深度学习应用
路演ppt原创 2018-03-01 14:52:11 · 3210 阅读 · 0 评论 -
名称匹配 建模详解 | 词袋模型、余弦相似度
央行征信中心需要完成百万级的企业名称匹配任务,做了这个ppt去给他们讲方案。ppt演示原创 2018-03-01 14:41:36 · 1565 阅读 · 2 评论 -
opencv实现猫脸识别
输入图片代码# -*- coding=utf-8 -*-import cv2# 加载猫脸检测器catPath = "haarcascade_frontalcatface.xml"faceCascade = cv2.CascadeClassifier(catPath)print('-'*20)# 读取图片并灰度化img = cv2.imread("cat3.jpg"原创 2017-12-28 16:26:50 · 4352 阅读 · 6 评论 -
磁条卡风控 建模方案
问题描述一.是基于高风险交易特点和持卡人行为特征,建立风险评估模型。 二.是根据风险等级实施差异化风险防控。对于风险较大,可疑程度较高的磁条交易采取精准识别、实时拦截等措施。 三.是通过交易行为分析、机器学习等不断优化风险评估模型,提高欺诈交易拦截成功率,切实提升银行卡交易安全防护能力。解决思路 图1 工作框图1.根据相关研究构建交易风险的评估指标。 参考指标:ATM累计交易笔数、ATM累原创 2017-12-15 09:50:05 · 601 阅读 · 0 评论 -
反欺诈建模方案
在反欺诈场景中,知识图谱聚合各类数据源,逐步绘制出借款人的profile,从而针对性的识别欺诈风险。以一个借款人举例,借款人可以有身份证号,手机号,学历等个人信息,属于个人的属性信息;而借款人可以有担保人或是亲属好友,借款人与担保人之间的关系(也就是边Edge)是被担保与担保的关系,借款人与其亲属好友之间的关系是父亲、母亲、同事、同学等关系;借款人也具有住址,银行流水,工作单位等信息。这些信息可以来原创 2017-12-15 09:43:53 · 12917 阅读 · 0 评论 -
主题提取 解决方案
一.获取数据用Python网络爬虫和NLP工具构建数据集 爬取过程: 1.调用API查询文章的元数据,包括每篇文章的URL 2.每个URL发送GET请求,找到HTML的正文文本,提取出来。 3.清理文章文本,去除停用词和标点二.文档向量化使用scikit-learn的IT-IDF Vectorizer模块三.用NMF做主题模型非负矩阵分解(Non-negativ...原创 2017-12-14 11:48:31 · 2054 阅读 · 0 评论 -
实现与个人电脑个性化语音交互 | 用python实现语音操作计算机应用demo
demo简介本测试是在windows上面跑,调用speech 实现电脑和人的语音交互软件介绍Microsoft Speech Platform 指的是微软语音平台,它包括了软件开发包SDK,运行时Runtime,以及各种语言包Language Packs(语音识别Speech Recognition和文本语音转换TTS).你可以使用该平台来为你的应用程序增加更多语音功...原创 2017-12-14 10:54:03 · 2227 阅读 · 0 评论 -
从0开始玩一玩xgboost |官网demo | 可选目标函数 | 各种评价指标 | 特征重要度可视化
背景结构化数据的分类问题都可以用xgboost来解决;nlp的分类问题使用bert来解决,nlp的所有问题都可以抽象成分类问题,也就是nlp问题都可以用bert来解决,包括命名实体识别、实体关系抽取、实体链接(百度叫实体链指)等。有兴趣可以看这个基于bert的实体关系抽取,点我这里说说xgboost怎么玩。官网博客,点我1.安装mac安装,我直接:pip install xgboos...原创 2020-01-09 20:52:44 · 604 阅读 · 0 评论 -
各种聚类算法(原理+代码+对比分析)最全总结
序言还是要持续总结,持续积累。一、聚类的目标使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。二、聚类算法分类1.基于划分给定一个有N个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K<N。特点:计算量大。很适合发现中小规模的数据库中小规模的数据库中的球状簇。算法:K-MEANS算法、K-MEDOIDS算法、CLARANS算法2....原创 2020-01-07 13:29:13 · 144831 阅读 · 38 评论 -
机器学习 python实战 | 特征选择、预测模型
前言袁同学学位论文需要,要做一个航空发动机相关的预测模型,了解需求后做了一下测试。 实现最简单的线性回归拟合。注:`·`后面的都是输出内容,不是代码1.导包import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.cross_validation im...原创 2017-12-14 10:14:07 · 3642 阅读 · 2 评论 -
初识机器学习-理论篇
刚开始接触机器学习时候上了相关课程做的笔记,当时做笔记本着给别人分享的原则写的,内容结构应该还算清晰、易懂,都是干货,希望给对机器学习感兴趣的童鞋带来帮助。1.什么是机器学习-认识机器学习利用计算机从历史数据找出规律,并把这些规律用运到对为了不确定场景的决策。 数据分析(经验、知识水平)&机器学习2.从数据中寻找规律规律:数学函数、数学公式 概率论数理统计(传统...原创 2018-02-08 11:08:36 · 536 阅读 · 0 评论 -
深度学习模型构建面临的问题及“吴恩达”的建议
关于模型搭建在一开始,尽量不要将问题复杂化(不要提前优化),先快速实现一个简单算法,然后通过交叉验证集评估模型。这就好比在软件工程中,不会做提前优化,而是先迭代功能。通过绘制学习曲线(learning curve),确定面临的问题是高偏差还是高方差,来决定是添加更多训练样本,还是添加更多特征。甚至可以手动检查交叉验证集中误差较大的样本,确定错误的来源和解决策略。关于准确率与召回...原创 2018-03-16 00:34:06 · 2075 阅读 · 0 评论 -
数据挖掘的最关键环节 | 数据预处理之特征选择、异常值处理、特征构造
异常值产生的原因数据输入错误测量误差实验误差故意异常值数据处理错误抽样错误异常值检测的方法可视化:画箱线图、散点图任何值超出四分位差的范围使用封顶法,任何超出5%或95%的任何值都被认为是异常值距离均值三个或更多标准差的被认为是异常值也取决于对业务的了解异常值处理方法类似缺失值的处理删除观察。 适用人为异常值变换合并值:比如log变换...原创 2018-03-13 19:06:07 · 3661 阅读 · 0 评论 -
机器学习最常用算法原理理解 | PCA、随机森林、AdaBoost
一、PCA将一组N维向量降为K维,其目标是选择K个单位正交基,使得原始数据变换到这组基上后,各字段两两间协方差为0,而字段的方差则尽可能大(在正交的约束下,取最大的K个方差)。算法步骤:设有m条n维数据。1.将原始数据按列组成n行m列矩阵X2.将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值3.求出协方差矩阵4.求出协方差矩阵的特征值及对应的特征向量...原创 2018-03-13 22:17:17 · 2526 阅读 · 2 评论 -
搞懂回归和分类模型的评价指标的计算:混淆矩阵,ROC,AUC,KS,SSE,R-square,Adjusted R-Square
今天看到某同学总结了回归和分类模型的评价指标,两篇博客讲的特别清楚,真心感谢博主的分享,蓝色的大标题是原文链接。回归模型的几个评价指标对于回归模型效果的判断指标经过了几个过程,从SSE到R-square再到Ajusted R-square, 是一个完善的过程:SSE(误差平方和):The sum of squares due to errorR-square(决定系数):Coe...转载 2018-09-14 15:28:50 · 8172 阅读 · 4 评论 -
讲清楚attention是怎么回事
近年来,attention一直是深度学习社区中相当流行的概念和有用的工具。 在这篇文章中,我们将研究如何发明attention,以及各种注意机制和模型,例如transformer和SNAIL。在某种程度上,注意力取决于我们如何对图像的不同区域进行视觉注意或将一个句子中的单词关联起来。 以图1中的Shiba Inu图为例。图 男士服装的Shiba Inu。人类的视觉注意力使我们能够专注于某个具...翻译 2019-07-21 12:18:23 · 1934 阅读 · 0 评论 -
图像识别、模式识别调研报告
整理资料看到了去年这时候写的调研报告,搬到CSDN上面。目前读完了tensorflow的官方文档,理解并跑通了三个数据集的代码。三个数据集是三个层次:MNIST数据集是灰度图像,不考虑结构信息,实现简单,精度很高;SIFAR-10数据集升级到RGB图像,考虑结构信息,用卷积神经网络实现分类;flower数据集是对一种植物的不同类别进行分类,难度更大一点,用四层卷积神经网络实现,由于目前的设备局限...原创 2018-09-29 16:02:37 · 2662 阅读 · 0 评论 -
机器学习之梯度下降训练法
一、梯度下降能实现什么?找到某个函数的极小值或最小值二、解决问题的类型高维,>1000维 纬度低,数据量小的情况下选择最小二乘法三、找误差函数的最小值一维情况:导数为0的点为最小值点(凸函数)或极小值点(非凸) 多维情况:就是求偏导数,以向量的形式表示。策略导数为负的时候增加自变量 导数为正的时候减小自变量 直到导数接近于0四、...原创 2017-12-15 10:00:29 · 1307 阅读 · 0 评论