自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shiter编写程序的艺术

大数据生态圈,计算机视觉,机器学习,高端技术的爱好者,话不多说,上代码!!!

  • 博客(620)
  • 资源 (133)
  • 论坛 (486)
  • 问答 (28)
  • 收藏
  • 关注

原创 朋友们!跟我来,一起抓住大数据时代的AI机遇!

21 世纪什么最值钱?人才!什么样的人才更值钱,懂大数据+AI 算法的人最值钱!我希望能够通过我自己的学习路径,资料的分享,和伙计们共同成长,降低学习成本提升学习效率,尽早迈入职业成长的快车道!

2021-04-17 14:34:54 685 5

原创 《基于大数据的机器学习原理与最佳实践》 ---- 总目录

本子目录主要是针对,在大数据环境下进行机器学习的相关内容介绍子目录,总体内容和目录还是以 《大数据处理实践探索》 为准, 本子目录的内容主要以spark 尤其是pyspark 进行机器学习为主线,围绕机器学习,深度学习全流程进行介绍。机器学习强调三个关键词:算法、经验、性能,其处理过程如上图所示。在数据的基础上,通过算法构建出模型并对模型进行评估。评估的性能如果达到要求,就用该模型来测试其他的数据;如果达不到要求,就要调整算法来重新建立模型,再次进行评估。如此循环往复,最终获得满意的经验来处理

2021-04-09 22:24:12 212

原创 《大数据+AI在大健康领域中最佳实践前瞻 》---- 总目录

文章大纲简介简介健康是人类永恒的主题也是社会进步的重要标志,健康已成为新世纪人们生活的基本目标。大健康产业具有巨大的市场潜力,未来在我国经济结构向服务业转型过程中,大健康产业将成为我国国民经济支柱型产业...

2021-03-14 00:04:26 985 7

原创 《大数据机器学习实践探索》 ---- 总目录

为了采集、存储和分析大数据,互联网公司尝试研发大数据技术,在众多技术方案中,开源系统 Hadoop、 Spark、Elasticsearch等 成为应用最广泛的大数据技术,由于它们的用户量巨大,已经初步成为大数据技术规范。本专栏《大数据处理实践探索》 通过记录**基于Python 的大数据处理实践探索案例**,力图将大数据与机器学习相结合 产生新的实践落地思路。 网络上的大数据相关博文多是基于java 或者Scala ,本专栏的目的在于基于python 将大数据,数据开发,与数据分析相结合。并在实践内

2021-02-18 22:38:21 517

原创 《自然语言处理实战入门》 ---- 总目录

随着人工智能的快速发展,自然语言处理和机器学习技术的应用愈加广泛。为使大家对该领域整体概况有一个系统、明晰的认识,同时入门一些工程实践,也借CSDN为NLP的学习,开发者们搭建一个交流的平台。我希望能够通过这个专栏《自然语言处理实战入门》和广大NLP爱好者一起学习自然语言处理技术,分享学习资料,打破NLP 技术 的实战应用壁垒。

2020-12-03 10:36:16 1268

原创 老王和他的IT界朋友们 ---- 交流渠道

既然 来了就都是我们的朋友,一路都在狂奔不止,感谢大家能花费宝贵的时间在这里驻足停留,老王会不遗余力的带给你美好。也许,我们会有停杯投箸不能食的时候,也有拔剑四顾心茫然的时候,干啥啥不顺,调啥啥不通,仿佛生活欺骗了你,此时此刻,彼时彼刻,脑海中只要浮现几个词:坚持,不忘初心。

2020-08-02 22:29:06 784 2

原创 从前有一个程序员,成天写代码,后来。。。

每天你都有机会和很多人擦身而过,而你或者对他们一无所知,不过也许有一天他会变成你的朋友或是知己……先来看看老王和他的IT界朋友们吧p.s 经常有人问我,老王,你明明可以穿的挺帅,为什么总是穿的很随意呢?其实道理很简单,我是做技术活的,打扮太好人家会以为我技术不行。从前有一个程序员,成天写代码,后来,他屎了1.一门可以靠手艺混饭的专业 你好,非常荣幸能够步入改变世界的软件开发行业,接下来我们聊点正经

2019-10-20 21:35:09 21806 59

原创 spark 特征工程 -- 分箱 Binning

文章大纲分箱操作简介spark 分箱函数 简介QuantileDiscretizerBucketizer两者区别参考文献分箱操作简介spark 分箱函数 简介QuantileDiscretizer文档说明:http://spark.apache.org/docs/latest/api/scala/org/apache/spark/ml/feature/QuantileDiscretizer.htmlhttp://spark.apache.org/docs/latest/ml-feature

2021-10-13 18:03:41 13

原创 《自然语言处理实战入门》深度学习 ---- 预训练模型的使用(ALBERT)

文章大纲简介bert 回顾bert 的问题ALBERT (A Lite BERT)改进1:将embedding的参数进行了因式分解改进2:跨层的参数共享改进3:抛弃了原来的NSP任务,现在使用SOP任务。参考文献简介bert 回顾bert 两阶段 模式:预训练 + 微调BERT 的总体预训练和微调程序。 除了输出层,在预训练和微调中都使用相同的体系结构。 相同的预训练模型参数用于初始化不同下游任务的模型。 在微调期间,所有参数都将进行微调。 [CLS]是在每个输入示例前添加的特殊符号,而[SEP]

2021-10-10 23:36:53 12

原创 《自然语言处理实战入门》深度学习基础 ---- Transformer 与Attention 架构初探

文章大纲简介参考文献简介循环神经网络,虽然它很强大,但是也存在一些弊端。其中比较突出的问题是,循环神经网络每个循环单元都有向前依赖性,也就是当前时间步的处理依赖前一时间步处理的结果。这个性质可以使序列的“历史”信息不断被传递,但是也造成模型运行效率的下降。特别是对于自然语言处理任务,序列往往较长,无论是传统的 RNN 结构,还是更为复杂的 LSTM 结构,都需要很多次循环单元的处理才能够捕捉到单词之间的长距离依赖。由于需要多个循环单元的处理,距离较远的两个单词之间的信息传递变得很复杂。针对这些问题,研

2021-10-06 01:38:09 13

原创 spark LightGBM 代码实现

Exiting finally...root |-- host_is_superhost: string (nullable = true) |-- cancellation_policy: string (nullable = true) |-- instant_bookable: string (nullable = true) |-- host_total_listings_count: double (nullable = true) |-- neighbourhood_cleanse.

2021-10-05 12:06:40 14

原创 在spark 中实现 scala 和 python 相互调用

文章大纲python 调用scalascala 调用 python使用jython参考文献python 调用scalapython 作为一种胶水语言调用其他语言比较容易scala 代码package exampleimport org.apache.spark.sql.DataFrame;import org.apache.spark.SparkContextimport org.apache.spark.SparkContext._import org.apache.spark.Spa

2021-10-05 12:05:42 19

原创 spark 数据采样

文章大纲简介分层抽样随机抽样代码样例scala 版本 sampleBypython版本参考文献简介spark scala最新版文档:http://spark.apache.org/docs/latest/api/scala/org/apache/spark/sql/DataFrameStatFunctions.htmlspark scala老版本的文档:http://spark.apache.org/docs/2.4.7/api/scala/index.html#org.apache.sp

2021-09-18 15:46:53 29

原创 spark 使用 LightGBM 原理解析

LightGBM于2016年10月17日发布,是微软分布式机器学习工具包(DMTK)项目的一部分。它快速且分布式的设计使得训练速度更快且内存使用率更低。它具有支持GPU、采用并行学习以及能够处理大型数据集等能力。LightGBM 在多个基准测试和公共数据集实验中甚至比 XGBoost 更快,更准确。

2021-09-17 15:00:07 35

原创 大数据AI系统解决方案与技术架构目录

大数据AI系统解决方案与技术架构针对日益场景的机器学习系统从设计模式、解决方案,逻辑架构出发给出最终落地实现的技术架构与深入思考。

2021-09-13 18:12:14 32

原创 大数据与人工智能在医疗健康领域的系统架构初探

文章大纲人工智能健康管理平台架构思路初探逻辑架构技术架构参考文献人工智能健康管理平台架构思路初探在医疗健康领域,我们将与数据相关的实体称之为数据实体,数据在生产,传输以及消费的过程,也正是数据实体自我作用或与其他实体相互作用的结果。例如医院信息系统中存放着大量医疗诊断数据,这些数据是病患与从业人员交互之后,留存在医院中的数据,这些数据可以被药物研制机构使用。在这个完整的数据生命周期中,数据的生产实体是病患与从业人员,数据的存储和传输的实体是医院,而数据的消费实体是药物研发机构。从业务本身出发,我们的健

2021-09-13 01:00:28 56

原创 spark 线性回归 scala 基本样例 (获取拟合方程)

文章大纲简介线性模型主要训练参数scala代码样例输出样例简介spark 线性回归样例:http://spark.apache.org/docs/latest/ml-classification-regression.html#linear-regression源代码:https://github.com/apache/spark/blob/v3.1.2/mllib/src/main/scala/org/apache/spark/ml/regression/LinearRegression.sc

2021-09-06 23:16:44 39

原创 Spark[pyspark与scala]实现将 DataFrame打印的函数show()的内容转换为字符串(Saving result of DataFrame show() to string )

文章大纲标准输入输出重定向scala 手动拼接参考文献标准输入输出重定向import java.io.ByteArrayOutputStreamval outCapture = new ByteArrayOutputStream Console.withOut(outCapture) { staticsDF.show() }val result = new String(outCapture.toByteArray)println(resu

2021-09-06 16:44:02 24

原创 基于阿里云的一般性系统安全措施介绍

文章大纲1. 基于阿里云的典型生产环境安全架构简介1.1 网络安全1.2 主机安全1.3数据库安全1.4应用安全1.5日志2. 源代码管理2.1源代码安全性保障2.2源代码的授权访问2.3源代码的复制和传播2.4源代码平台日常管理3. 堡垒机访问控制3.1概述3.2权限控制3.3堡垒机的授权访问4. RDS数据库访问控制4.1概述4.2RDS数据账号权限控制4.3白名单5. 数据备份\恢复5.1备份系统日常管理5.2日常巡检管理6. ACM应用配置管理6.1目的6.2ACM作用6.3ACM管理维护7. 应用

2021-09-06 00:49:29 61

原创 基于阿里云的系统灾备方法架构与安全应急预案介绍

文章大纲1. 阿里云服务可用性承诺2. 阿里云容灾方案2.1 阿里云容灾方案1. 阿里云服务可用性承诺1.1 ECS(1)对于单实例维度, 阿里云承诺一个服务周期内ECS的服务可用性不低于99.975%;(2)对于单地域多可用区维度,阿里云承诺一个服务周期内ECS的服务可用性不低于99.995%。1.2 RDS(1)云数据库三节点企业版三可用区/高可用版独享型不低于99.99%;(2)云数据库三节点企业版非三可用区/高可用版通用型/SQL Server集群版不低于99.95%。1.3 SL

2021-09-05 19:38:18 58

原创 2021 年的一些体会:工作,家庭,投资,面试

声明: 本故事纯属虚构,如有雷同,纯属巧合!我们不妨几年后,再回过头来看看,现在的选择是否正确,我们拭目以待!

2021-09-04 22:58:15 678 2

原创 Spark ML 正则化 标准化 归一化 ---- 扩展 spark 中的归一化 函数

扩展spark 的归一化函数以Logistic 归一化为例,整体思路就是:首先计算公式中需要用到的值,比如mean将计算后的值封装在vector 中,针对需要计算的列依次使用math 函数进行计算在withColumn 中使用udf 进行计算...

2021-08-28 23:50:22 32

原创 Spark ML 正则化 标准化 归一化 ---- spark 中的归一化

spark 中的归一化MaxAbsScalerhttp://spark.apache.org/docs/latest/api/scala/org/apache/spark/ml/feature/MaxAbsScaler.htmlMinMaxScalerhttp://spark.apache.org/docs/latest/api/scala/org/apache/spark/ml/feature/MinMaxScaler.htmlRescale each feature individua

2021-08-28 23:48:32 25

原创 Spark ML 正则化 标准化 归一化 ---- spark 中的 标准化

spark 中的标准化StandardizesStandardizes features by removing the mean and scaling to unit variance using column summary statistics on the samples in the training set.The “unit std” is computed using the corrected sample standard deviation, which is compute.

2021-08-28 23:47:18 29

原创 Spark ML 正则化 标准化 归一化 ---- spark 中的正则化

spark 中的正则化Normalizer标准化文档:http://spark.apache.org/docs/latest/api/scala/org/apache/spark/ml/feature/Normalizer.html标准化源代码:https://github.com/apache/spark/blob/v3.1.2/mllib/src/main/scala/org/apache/spark/ml/feature/Normalizer.scala文档中就这么一句话:Nor

2021-08-28 23:45:55 18

原创 聚类算法 ---- 大数据聚类算法综述

文章大纲简介聚类算法的分类相似性度量方法大数据聚类算法聚类算法对比参考文献简介随着数据量的迅速增加如何对大规模数据进行有效的聚类成为挑战性的研究课题,面向大数据的聚类算法对传统金融行业的股票投资分析、 互联网金融行业中的客户细分等金融应用领域具有重要价值, 本文对已有的大数据聚类算法,以及普通聚类算法做一个简单介绍聚类分析是伴随着统计学、计算机学与人工智能等领域科学的发展而逐步发展起来的,为此,这些领域若有较大的研究进展,必然促进聚类分析算法的快速发展。比如机器学习领域的人工神经网络与支持向量机

2021-08-19 23:39:46 145

原创 Spark ML 正则化 标准化 归一化 ---- 基本概念简介

文章大纲简介正则化标准化(standardization)归一化spark 中的标准化spark 中的归一化参考文献简介正则化标准化(standardization)数据标准化是将数据按比例缩放,使其落入到一个小的区间内,标准化后的数据可正可负,但是一般绝对值不会太大,一般是z-score标准化方法:减去期望后除以标准差。x∗=x−uσx^\ast=\frac{x-u}\sigmax∗=σx−u​特点:对不同特征维度的伸缩变换的目的是使其不同度量之间的特征具有可比性,同时不改变原始数

2021-08-16 15:31:28 372

原创 AutoML 前瞻与实践 ---- 自动化机器学习 利器 tpot(Tree-based Pipeline Optimization Tool) 入门与实践

文章大纲简介参考文档简介github:https://github.com/EpistasisLab/tpot文档:http://epistasislab.github.io/tpot/随着数据科学变得越来越主流,对更可访问、更灵活和可扩展的数据科学工具的需求将不断增长。为了满足这一需求,自动机器学习(AutoML)的研究人员已经开始构建自动化设计和优化机器学习管道过程的系统。在本章中,我们提出了TPOTv0.3,这是一个基于开源遗传编程的AutoML系统,它优化了一系列特征预处理器和机器学

2021-08-09 10:14:11 218

原创 AutoML 前瞻与实践 ---- 自动化特征工程

文章大纲简介参考文献简介自动化特征工程特征工程主要包括包括特征选择、特征预处理和特征压缩3个大模块,这些处理步骤中往往包含很多的方法,例如如何为数据选择适合的方法,如何通过数据构造新特征,这些问题都是传统特征工程所面临的困境,传统的特征工程效率低下,可移植性差,往往手工建立的特征只适合于特定的问题。因此自动化特征工程则是从数据中自动构建新的候选特征,并选择最佳的特征进行模型的训练,其意义在于可以超越传统特征工程中面临的困境。什么是自动化特征工程随着人工智能的发展,人类希望可以通过人工智能

2021-08-08 00:15:05 216

原创 AutoML 前瞻与实践 ---- AutoML 简介

文章大纲00 -- 简介研究动机意义和作用现有AutoML 平台产品autoML 前景展望参考文献autoML系列文章目录00 – 简介机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML视图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。2012年,AlexNet为了充分利用多个GPU的算力,创新性地将深度神经网络设计成两部分,使网络可以在两个GPU上进行训练。2013年,ZFN

2021-08-07 23:52:30 327

原创 spark 中的数据类型

文章大纲简介sql.typeVector 数据类型数据类型转换参考文献简介从文档里面可以看到,datatype 就是这么多:https://spark.apache.org/docs/latest/api/scala/org/apache/spark/sql/types/DataType.html#typeName:Stringsql.typehttps://github.com/apache/spark/blob/v3.1.2/sql/catalyst/src/main/scala/org

2021-08-03 15:21:47 81

原创 Spark 聚类算法 ---- 聚类算法效果评估

文章大纲简介spark 聚类评估轮廓系数Calinski-Harabasz 指标SSBSSW参考文献简介spark 聚类评估class ClusteringEvaluator extends Evaluator with HasPredictionCol with HasFeaturesCol with HasWeightCol with DefaultParamsWritableEvaluator for clustering results. The metric computes the

2021-08-03 00:46:14 82

原创 《大数据+AI 赋能传统传统行业经典落地案例浅析》 ---- 总目录

文章大纲金融行业 落地实践浅析大健康行业 落地实践浅析传统行业深度融合升级参考文献AI 相关技术伴随着2006年 计算机算力的膨胀开始,蓬勃发展至今。从传统机器学习到深度学习再到大力出奇迹的BERT , GPT 经历了一轮又一轮的热潮。现代公司制度已有近百年,更是在近年来积累了大量数据。每个企业都将不可避免的面对堆积如山的海量数据,如何处理并从海量数据中挖掘信息,进行信息化转型,提升企业战斗力,是含金量极高的一门技艺。大数据技术为AI 技术提供了大量弹药,从上帝视角出发解读世界。本专栏,带你从上帝

2021-07-29 00:27:40 125

原创 autoML 前瞻与实践 ---- H2O Sparkling Water简介

Sparking Water擅长利用现有的基于Spark的工作流,这些工作流需要调用高级机器学习算法。一个典型的例子是借助spark api进行数据挖掘, 使用一个准备好的表被传递给H2O进行深度学习算法自动学习。构建的深度学习模型基于测试数据估计不同的度量,这些度量可用于Spark工作流的其余部分。

2021-07-28 00:23:51 101

原创 《大数据机器学习实践探索》 ---- 特征工程:基于spark 的缺失值处理

缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。本文针对spark 机器学习过程中,针对数据框,dataframe dataset 中出现的缺失值处理方案,进行总结。

2021-07-24 20:22:43 109 1

原创 《大数据机器学习实践探索》 ---- 使用spark MLlib进行机器学习(3.2 超参数调优:交叉验证)

文章大纲k-Fold交叉验证交叉验证原理在Spark中执行超参数搜索参考文献k-Fold交叉验证我们应该使用哪个数据集来确定最优超参数值?如果我们使用训练集,那么模型很可能会过度拟合,或者记住我们训练数据的细微差别。这意味着它不太可能推广到看不见的数据。但是,如果我们使用测试集,那么这将不再代表“看不见的”数据,因此我们将无法使用它来验证我们的模型泛化的程度。因此,我们需要另一个数据集来帮助我们确定最优的超参数:验证数据集。交叉验证原理例如,像我们做的那样,将我们的数据分割成 80/20 训练集/

2021-07-15 12:03:59 50

原创 autoML 前瞻与实践 ---- 如何做基于spark 的 自动化机器学习?

机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML视图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。

2021-07-13 16:05:22 87

原创 spark 分类 模型 -- 逻辑回归 原理解析与代码样例

Logistic回归是一种常用的预测分类反应的方法。这是广义线性模型的一个特例,可以预测结果的概率。在spark.ml中,logistic回归可用于使用二项logistic回归预测二元结果,也可用于使用多项logistic回归预测多组结果。使用family参数在这两种算法之间进行选择,或者不设置它,Spark将推断出正确的变量。通过将族参数设置为“多项式”,多项式logistic回归可用于二元分类。它将产生两组系数和两个截距。Spark MLlib在对非零列为常数的数据集进行无截距的Lo

2021-07-05 23:27:24 50

原创 IT 生涯初探与工作经验分享【计算机、软件工程相关专业毕业生应该知道的事】---- 来自2008级学长的掏心窝分享

在即将到来的就业季,希望本文能从过来人的角度给学弟学妹们一些有效的方向指导与资料分享,让你们少走一些弯路。本文有以下两个主要内容:1. 联系实际从职业前景展望出发,围绕IT行业未来5-10 年前景展望,给同学们介绍了大数据机器学习、自然语言处理两个较为有前景的细分行业。2. 以工作经验分享为基础帮助同学们进行IT行业的职业规划,并进行了笔试、面试技巧、简历书写等的指导。

2021-07-04 19:03:36 373 6

原创 离线环境的中文语音识别 paddlepaddle 与 Speech_Recognition(Sphinx)实践

本文主要针对中文语音识别问题,选用常用的模型进行 离线 demo 搭建及实践说明。

2021-07-03 09:30:07 243 1

基于稠密匹配论文合集

基于稠密匹配的论文合集,包含了国内外的论文合集,方便大家科研

2016-07-31

基于opencv的手写数字字符识别

实现了基于opencv 的手写数字字符识别 主要参照文章: http://blog.damiles.com/2008/11/basic-ocr-in-opencv/ 基本上就是按着人家的代码来配置的,完后小改动了几个参数,写了一个文档,方便大家学习吧。

2013-11-29

python机器学习资料小合集

python机器学习资料小合集,包括机器学习十大算法以及python机器学习等资料指导,一些训练常用的代码和数据集

2017-04-19

工业互联网白皮书参考

工业互联网白皮书参考,包含富士康,西门子,等工业互联网厂商的白皮书资料。以及世界五百强企业的白皮书资料,方便大家学习,解压密码:123456

2020-03-30

导向滤波原理以及解释

基于导向滤波的work论文,写的非常详细,希望能够帮助到广大科研人员

2016-01-04

电子病历命名实体识别研究资料与ccks2020论文集合.zip

电子病历命名实体识别研究资料与ccks2020论文集合,详见博客:https://season.blog.csdn.net/article/details/115283564

2021-04-19

基于BMP格式图片的指纹对比分析识别系统

基于bmp图片的指纹对比分析识别系统,核心程序是国外两个学生做的毕业设计,我就拿来直接改了改,基本上实现了256*256灰度指纹图像的识别过程,直方图增强,读表法细化,细节点对比。程序开发环境运行环境vs2008+skin++(界面美化),windows xp

2012-04-26

人工智能医疗器械数据集标准参考

构建人工智能医疗器械数据集需要遵循哪些国家标准呢,本资源进行了标准参考的探寻,和基本的论文收集,希望能够帮助到大家。详细内容参见博客:https://season.blog.csdn.net/article/details/113741142

2021-03-13

立体匹配方法基础

立体匹配方法基础,主要讲述了一些立体匹配的研究背景和意义,可以作为一个科普ppt

2016-05-30

计算机专业基础理论电子书合集01

计算机专业基础理论电子书合集01 包括:编译原理,运筹学,和基本的算法理论

2016-08-07

基于置信传播的立体匹配论文合集

基于置信传播的立体匹配论文合集,包含了国内外的论文合集,方便大家科研

2016-07-31

基于图像分割的立体匹配论文合集

基于图像分割的立体匹配论文合集,包含国内外经典论文合集,方便大家科研

2016-07-31

立体匹配综合论文集

立体匹配综合论文集,包含立体匹配领域的各类经典论文合集

2016-07-31

并行立体匹配论文合集

基于并行计算的立体匹配论文合集,包含国内外经典论文合集,方便大家科研

2016-07-31

win32磁盘扫描文件搜索程序

win32磁盘扫描文件搜索程序,结合配置文件全盘搜索特定后缀文件,速度很快,推荐看看

2014-12-26

图论及其算法在计算机视觉中的应用

图论及其算法在计算机视觉中的应用,介绍了一般的图割算法在计算机视觉中的应用

2014-12-10

文本和文档可视化.pptx

文本可视化涉及文本信息提取技术和可视表达两个方面。本章介绍了文本可视化领域常用的文本可视化基础知识和方法以及文本信息提取技术,并从文本内容、文本关系、多层面展示信息的角度阐述了文本可视化的研究内容和现有成果。需要注意的是,这三个层 面不是相互隔离的,而是相互连通的。 文本可视化不同于具有空间属性的科学可视化——文本信息没有空间位置等结构化信 息。因此,如何将没有空间结构属性的文本信息转换为用户乐于接受的二维或三维空间的可视表达结果是文本可视化面临的一个核心问题。在未来的文本可视化研究中,如何将文本分析模型和信息可视化技术无缝结合,如何更好地处理海量、时变、具备多重语义的文本信息是极大的研究挑战。

2020-02-23

数据接入及清洗相关资料.zip

主要搜集了,网络上,数据接入,清洗,ETL 等相关书籍论文,希望能够帮助大家。 数据清洗是大数据不可缺少的步骤之一

2019-10-08

数据清洗ppt-181119.zip

清华大学课程ppt----数据清洗并没有统一的定义,其定义依赖于具体的应用领域。从广义上讲,数据清洗是将原始数据进行精简以去除冗余和消除不一致,并使剩余的数据转换成可接收的标准格式的过程;而狭义上的数据清洗特指在构建数据仓库和实现数据挖掘前对数据源进行处理,使数据实现准确性、完整性、一致性、唯一性和有效性以适应后续操作的过程。一般而言,凡是有助于提高信息系统数据质量的处理过程,都可认为是数据清洗。

2020-12-04

stanford-chinese-corenlp-2018-10-05-models.jar

stanford-chinese-corenlp-2018-10-05-models,github 下载速度太慢,特地上传方便大家下载

2020-08-04

OpenCV+OpenGL 双目立体视觉三维重建

OpenCV+OpenGL 双目立体视觉三维重建代码以及文档 使用opencv进行立体匹配获取视差图,三角剖分 使用opengl进行纹理贴图 需要配置opengl,opencv,vs2015工程 博客地址: http://blog.csdn.net/wangyaninglm/article/details/52142217

2016-08-08

基于OpenCV 的美颜相机推送直播流--正式版

程序流程: 1.图像采集 先从opencv(2.4.10版本)采集回来摄像头的图像,是一帧一帧的 每一帧图像是一个矩阵,opencv中的mat 数据结构。 2.人脸的美化 人脸美化,我们用的皮肤检测,皮肤在颜色空间是特定的一个区域 检测到这个区域(感兴趣区域),完后对这个区域进行美化,就是滤波,主要是双边滤波和高斯滤波。 3.视频格式转换以及编码 处理好的矩阵颜色空间是rgb的,需要转换成yuv,yuv的颜色空间就是可以播放的,类似我们电视上面看的画面,编码就是传输时候需要发送流,只个流相当于针对数据的压缩,将yuv格式的视频帧编码成h264的格式 Rgb转换成yuv,opencv实现(美颜在这一步实现) Yuv转换成h264,x264实现 H264转换成rtmp流,libxrtmp实现 4.发送给服务器进行直播 H264的流一般就可以播放了,但是针对目前的网络直播主要是将h264转换成rtmp流,用rtmp 的服务器进行播放,这块我们主要用的是adobe media server 5这个服务器进行接受工作

2016-04-04

OpenCV实时美颜摄像并生成H264视频流

为什么美颜摄像这么简单的功能,OpenCV这个开源项目网上很少有代码呢?对于在windows平台下,生成h264视频流也比价麻烦,没有现成的api可以使用,需要借助MinGw编译libx264,或者ffmpeg才能使用。 最近有个小需求,要推送直播视频流,我在网上查了一下有live555或者用librtmp来推送,但是前者还需要修改源代码,也挺麻烦的,现在先做到了下面几个步骤: 1.OpenCV捕捉摄像头的图像 2.进行识别需要美颜的部分(人脸识别,肤色识别) 3.进行美颜(提升亮度,直方图均衡,滤波) 4.生成YUV视频 5.生成h264

2016-03-04

《自然语言处理实战入门》 第4课 :中文分词原理及相关组件简介 之 语言学与分词技术简介 参考资料.zip

《自然语言处理实战入门》 第4课 :中文分词原理及相关组件简介的 主要内容 有如下三个部分: 博客链接:https://blog.csdn.net/wangyaninglm/article/details/90587705 汉语语言学简介 汉语分词领域主要服务、手段、方法 分词原理最佳实践(以jieba为例) 本资源为课程ppt 及相关资料合集

2019-07-30

基于图割的图像分割OpenCV+MFC实现

基于图割的图像分割OpenCV+MFC实现,opencv 的路径需要重新配置一下,我编译的是64位版本

2015-03-09

hbase简介ppt

hbase简介,主要从hdfs开始介绍hbase,讲的比较细致生动

2016-04-12

计算机专业基础理论电子书合集12----hive,pig

计算机专业基础理论电子书合集12----hive,pig hive,pig 权威指南以及其他资料合集

2016-08-24

OpenCV+OpenGL利用视差图进行三维重建

OpenCV+OpenGL利用视差图进行三维重建,对于双目摄像机拍摄的经过外极线矫正的图像,进行立体匹配,根据特征点进行三角剖分,纹理贴图,最后进行三维重建。

2016-07-22

陕师大计算机考研历年真题

陕师大计算机考研历年真题,自主命题基本题型这几年都没什么变化,需要的同学就来下载吧

2015-10-20

医疗信息基础数据知识库

医疗信息基础数据知识库包含:经过本人整合的医院信息库,疾病信息库,3目录信息库,诊疗信息库。整合过程参照:https://season.blog.csdn.net/article/details/114806917

2021-03-15

OpenCV空洞填充算法工程以及代码

说明: http://blog.csdn.net/wangyaninglm/article/details/47701047 在Matlab下,使用imfill可以很容易的完成孔洞填充操作,感觉这是一个极为常用的方法,然而不知道为什么Opencv里面却没有集成这个函数。在网上查了好多关于Opencv下的孔洞填充方法,大部分使用轮廓查找方法去做的,但对于这种方法,总感觉不是特别好。之前了解过冈萨雷斯那本书上的孔洞填充算法,所以想着手重新写一个。这里借鉴了冈萨雷斯书上的集合运算方法(并不完全一样)

2016-01-04

ccks 2020 全国知识图谱与语义计算大会 参考PPT

资料源自:http://sigkg.cn/ccks2020/ 主要介绍了最新的知识图谱 研究相关的进展及内容

2020-12-01

windows linux—unix 跨平台通信集成控制系统--客户端

windows linux—unix 跨平台通信集成控制系统,c、c++编写完成客户端文件信息等的收集传输等工作。远程cmd命令执行,文件上传下载,等功能。带有基本注释。详细参照http://blog.csdn.net/wangyaninglm/article/details/41940287

2015-01-04

OpenCV实现实时统计人脸并进行跟踪

OpenCV实现实时统计人脸并进行跟踪,vs2013,2015,需要按照64位系统进行配置

2016-08-27

OpenCV计算物体重心坐标代码以及工程

说明: http://blog.csdn.net/wangyaninglm/article/details/49618769

2016-01-04

六工况汽车燃油经济性计算

六工况,汽车燃油经济性计算。采用国标,根据不同的i0主传动比,绘制燃油经济性曲线。mfc --vs2008开发,就算是课程设计级别的东西吧。

2012-06-11

opencv opengl 手写英文字母识别

opencv opengl 手写英文字母识别

2014-12-10

人工智能医疗器械数据集的构建标准.zip

CFDAB-T0501-2014_Specifications_for_database_design_of_food_and_drug_administration.pdf LIMS针对检测实验室检测可溯源性的应用与研究.pdf 'TCT 扫描切片 属性维度.mm' 大数据环境下数据对象的可溯源性保障方法研究.pdf '附件3_《人工智能医疗器械质量要求和评价 第2部分:数据集通用要求》征求意见稿.pdf' '附件4_《人工智能医疗器械质量要求和评价 第2部分:数据集通用要求》编制说明.pdf' 宫颈癌标准诊断简介.docx 宫颈癌智能阅片产品MI.docx 宫颈细胞学.ppt 基于医疗健康大数据的安全起源模型与可信性验证算法.pdf 人工智能医疗器械用数据集管理与评价方法研究.pdf 深度学习辅助决策医疗器械软件审评要点.doc 数据集参考总结.pptx 数据集在人工智能医疗器械质控中的角色与要求.pdf 调研-数据集及数据标准.pdf 医疗器械的数据完整性.pdf 医疗器械软件技术审查指导原则(第二版征求意见稿).docx 医疗器械软件注册技术审查指导原则.docx 医疗器械生产质量管理规范附录.doc 医学数字影像通信基本数据集.pdf 医学图像来源与篡改检测算法研究.caj 医学影像信息系统中图像数据的管理及安全策略.pdf 以图搜图.png

2021-09-05

One cut in grabcut的OpenCV实现代码以及工程

说明: http://blog.csdn.net/wangyaninglm/article/details/50074613 One cut in grabcut(grabcut算法的非迭代实现?) 本文针对交互式图像分割中的图割算法,主要想翻译一篇英文文献。不足之处请大家指正。 这是博主近期看到的效果最好,实现最简单,运算时间最短的交互式图割算法,而且由于是发明图割算法实验室原班人马的文章和代码,所以非常值得研究。

2016-01-04

三维重建本科生毕业设计

双目立体视觉方法采用两台摄像机模拟人类双眼处理景物的方式,从两个视点观察同一场景,获得不同视角下的一对图像,然后通过左右图像间的匹配点,恢复出场景中目标物体的几何形状和位置等三维信息。该项技术在机器人视觉、车辆自主驾驶、多自由度机械装置控制、非接触自动在线检测等领域均具有很大的应用价值。

2016-06-01

问一个算法题,有点不知道怎么做,囚徒逃离岛屿问题

发表于 2019-11-16 最后回复 2020-08-09

单步调试总进入disassembly

发表于 2013-02-06 最后回复 2020-07-31

opencv的话如何统计,轮廓内部的像素点个数?

发表于 2014-02-26 最后回复 2020-07-12

写了一个实时检测皮肤,并且美化的代码,这块怎么优化一下呢?

发表于 2016-03-04 最后回复 2020-06-16

100万url找到出现频率最高的100个

发表于 2015-07-25 最后回复 2020-06-04

mfc基本对话框工程,如何获取主对话框的窗体句柄?

发表于 2013-05-07 最后回复 2020-06-03

图形处理版的论坛新手们发帖前看一下-----------------------------------!!!!!!!!!!!!!!!!!!!!!

发表于 2016-03-05 最后回复 2020-04-10

Python调用一些win32接口,如剪贴板什么的,还能否在Linux下跑

发表于 2017-01-10 最后回复 2020-03-29

shiter的留言板

发表于 2020-01-02 最后回复 2020-03-01

类似这样的矩形检测怎么做,opencv

发表于 2015-02-24 最后回复 2020-01-21

祝大家新春快乐

发表于 2018-02-19 最后回复 2020-01-06

普通的算法,能否改写成cuda加速的gpu执行的算法

发表于 2014-10-09 最后回复 2019-11-18

如何计算统计值 的百分比呢?

发表于 2018-06-21 最后回复 2019-10-08

Null是零还是啥,怎么不能给string赋值为null,只能赋值为“”

发表于 2015-05-19 最后回复 2019-09-30

为啥csdn 其他频道都是好的,但是博客频道就是不能访问?而且能ping通?

发表于 2015-02-18 最后回复 2019-09-05

现在做安全方面的很吃香么?最近看学姐学长们应聘,大公司的软件工程师要求好高啊,都是acm流的,其他岗位什么机器学习数据挖掘也没做过项目。

发表于 2014-10-16 最后回复 2019-09-05

有没有人节分。。。。

发表于 2014-10-13 最后回复 2019-09-05

memcpy出错

发表于 2013-07-30 最后回复 2019-08-12

求个代码,c++读取txt,并排序其中的数字,一行一个数字就行了

发表于 2013-06-16 最后回复 2019-07-01

请问win10操作系统官方纯净版下载链接

发表于 2016-08-08 最后回复 2019-03-23

多线程程序,分配内存,或者释放时候总是出错,求解决办法

发表于 2016-04-02 最后回复 2019-03-08

找到一个数的连续整数和,要求最短

发表于 2015-09-20 最后回复 2019-02-05

python从txt中提取每一行的中文?请问怎么提取?

发表于 2016-07-24 最后回复 2018-11-19

rhel 下有啥好使的c语言 profile工具?求指导

发表于 2017-08-17 最后回复 2018-06-24

如何让c++程序在英文系统下面支持控制台输出中文

发表于 2015-05-29 最后回复 2018-06-08

游戏服务器中实时显示的全服排名是怎么实现的?

发表于 2018-05-15 最后回复 2018-06-08

linux下如何将,控制台输出的所有内容,全部输出到一个文本文件

发表于 2013-06-06 最后回复 2018-06-01

请问一个数据导入的命令应该如何写的问题?impdp

发表于 2018-03-27 最后回复 2018-03-31

win32下,如何删除ini文件中的某一键值?

发表于 2013-03-05 最后回复 2018-03-23

求教牛人,为啥不一样的?

发表于 2017-12-25 最后回复 2017-12-26

hugepage/这个为啥有时候要设置成never,不是说可能提高内存性能么?

发表于 2016-10-07 最后回复 2017-12-25

在python中,字符串如何进行全字符匹配?

发表于 2017-04-16 最后回复 2017-12-25

c语言中有单例模式么?单例的演化模式 是否为,单线程--多线程--分布式

发表于 2017-11-25 最后回复 2017-12-02

opencv的字符识别,英文加数字能识别就行了

发表于 2013-11-19 最后回复 2017-12-01

11月份活动----为了解决本版的疑难杂症帖子,加分什么的请私信我

发表于 2016-11-04 最后回复 2017-11-30

基于图割算法的图像分割----OpenCV代码与实现

发表于 2015-03-09 最后回复 2017-10-09

1024!末尾有几个零?

发表于 2012-02-06 最后回复 2017-08-29

年底了,我作为版主能不能给大家发点技术分?从今天发到过年一天一个?我尽量每天一个帖子

发表于 2016-01-31 最后回复 2017-08-10

const int全局变量数组初始化

发表于 2017-07-18 最后回复 2017-08-03

最长回文字符串出错,求解

发表于 2016-08-18 最后回复 2017-04-16

这种类似url 映射到服务器的目录,是咋实现的?

2021-05-10

spark 本地 maven 工程报错

2021-04-21

有哪些开源的拖拽式机器学习框架可以介绍一下,类似阿里机器学习PAI这种?

2021-03-30

mongodb数据导出太慢,求快速导出数据的办法

2017-09-17

能让yarn瞬间提升负载得方法?

2017-08-31

linux shell脚本,多个主机同步时间

2016-09-18

Python程序用到了com接口,调用windows下面剪贴板什么的

2017-01-10

cdh 集群启动management service报错

2016-10-09

linux shell 批量处理相同后缀文件

2016-08-20

请问win10操作系统官方纯净版下载链接

2016-08-08

python从txt中提取每一行的中文

2016-07-24

如何通过训练达到解决复杂算法问题的能力?

2016-07-20

请问大型网站中实时排名如何实现?

2016-05-17

电脑发送消息给手机的方法

2016-04-13

开发支持高并发的webservice,现在一般用哪些技术?

2015-10-26

按钮添加超级链接,应该怎么改改,或者超链接是按钮样式

2015-04-24

swift 设置控件在手机中间?

2015-09-11

python获取100万个不同的URL?

2015-07-20

将一个html中的文本表单提交到另一个html上

2015-04-20

ios swift 多个界面,viewcontroller应该怎么写呢?

2015-06-29

如何访问xml中所有标签为label 的内容

2015-05-15

xtion pro和xtion pro live区别?

2015-04-20

ios swift string 类型转化为CGfloat给CGRectMake

2015-06-29

这样的图用什么作图软件可以画出来?

2015-01-25

swift 环形进度条,显示不出来

2015-07-09

Azure平台支持那些虚拟系统呢?更适合微软的系统么?

2015-01-23

为什么要这样颜色转换,有什么理论支撑?

2015-01-21

虚拟化技术是是如何实现的?

2015-01-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除