![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
Mr_不想起床
努力工作,环游世界!
展开
-
中文文本时间抽取、时间转换及标准化
分享一个用于文本中的时间抽取、时间转换、时间标准化的实用工具。简介Time-Extractor的python3版本功能说明用于句子中时间词的抽取和转换, 主要基于Time_NLP做了部分优化效果如下:res = tn.parse(target=u'晚上8点到上午10点之间') # target为待分析语句,timeBase为基准时间默认是当前时间print("extract_result:", res)res = tn.parse(target=u'2020年二月二十八日下午四点三十分二十九原创 2020-12-26 13:54:08 · 1866 阅读 · 0 评论 -
人脸聚类框架(Face Cluster Framework)
Face Cluster Framework (人脸聚类框架)English Version | 中文版Intorduction一个人脸图片聚类框架对于给定的大量待聚类人脸图片,利用人脸特征抽取组件(face_feature_extract)进行人脸特征抽取,并对用抽取的人脸特征进行人脸聚类并进行图片归档。采用的人脸聚类算法较当前主流人脸聚类算法效果更优,具体测评效果详见人脸聚类Cluster Result输入数据:部分聚类效果:RequirementsPytho原创 2020-12-01 19:48:18 · 5660 阅读 · 2 评论 -
一种无监督人脸聚类方法(SOTA效果)
Learning to Cluster Faces by InfomapIntorduction采用了无监督方法infomap进行人脸聚类(github),在MS-Celeb-1M(part1_test)及多份私有数据集上获得较当前主流方法更优的效果,测试结果对比详见下表.Infomap IntorductionInfomap WebsiteRequirementsPython >= 3.6sklearninfomapnumpyDatasetsMS-Celeb-1M : pa原创 2020-11-23 17:34:28 · 3668 阅读 · 9 评论 -
基于知识图谱的语义理解技术及应用
知识图谱在人工智能应用中的重要价值日益突显。百度构建了超大规模的通用知识图谱,并在搜索、推荐、智能交互等多项产品中广泛应用。同时,随着文本、语音、视觉等智能技术的不断深入,知识图谱在复杂知识表示、多模语义理解技术与应用等方面都面临新的挑战与机遇。本文将介绍百度基于知识图谱,从文本到多模态内容的理解技术及应用的最新进展。本文主要内容包括: 背景 知识图谱文本语义理解 知识图谱视频语义理解 总结 01▬背景1.多模语义理解需求强烈多模语义理解需求.转载 2020-11-24 20:55:10 · 2786 阅读 · 0 评论 -
基于知识图谱构建新一代数据智能基础设施
导读:人工智能作为国家新基建战略的重点建设项目,是新一轮产业变革的核心驱动力量。当前人工智能正由感知智能走向认知智能,而知识图谱是实现认知智能的基石。知识图谱作为是大数据时代的知识工程集大成者,以其强大的语义表示能力、存储能力和推理能力,为互联网时代的数据知识化组织和智能应用提供了有效的解决方案。本次分享将探讨如何基于知识图谱构建新一代数据智能基础设施,实现海量多模态数据的深度语义化治理。主要内容包括: 新基建简介 知识图谱助力新基建 基于知识图谱的智能数据治理 基于知识转载 2020-11-24 13:56:37 · 3594 阅读 · 0 评论 -
STSGCN:时空同步图卷积神经网络用于交通预测
文章信息《Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting》。由北京交通大学计算机学院万怀宇和林友芳老师团队的硕士生宋超和博士生郭晟楠完成,已被AAAI 2020接收。摘要本文提出了一种基于图卷积方法的时空网络预测方法,该方法以路网结构为基础,将多个近邻时间步的空间图连接到一起,使用图卷积方法捕获复杂的转载 2020-11-09 15:05:00 · 4530 阅读 · 3 评论 -
智能交通流量预测方案收集(持续更新)
交通流量预测应用方案收集(欢迎补充、持续更新…)论文合集基于时间图卷积网络(T-GCN)交通流预测(A Temporal Graph Convolutional Network for Traffic Prediction) 2019IEEE一种基于神经网络的交通预测方法,该模型结合了图卷积网络(GCN)和门控递归单元(GRU)。GCN用于学习复杂的拓扑结构来捕获空间依赖关系,GRU用于学习交通数据的动态变化来捕获时间依赖关系。论文下载链接实现链接tf基于注意力机制的时空图卷积网络原创 2020-11-09 14:26:26 · 3429 阅读 · 3 评论 -
LightGBM操作指南
转自:https://mp.weixin.qq.com/s/9gEfkiZyZkoIgwRCYISQgQLightGBM是基于XGBoost的一款可以快速并行的树模型框架,内部集成了多种集成学习思路,在代码实现上对XGBoost的节点划分进行了改进,内存占用更低训练速度更快。LightGBM官网:https://lightgbm.readthedocs.io/en/latest/参数介绍:https://lightgbm.readthedocs.io/en/latest/Parameters.h转载 2020-10-20 10:15:57 · 1218 阅读 · 0 评论 -
知识蒸馏在推荐系统的应用
随着深度学习的快速发展,优秀的模型层出不穷,比如图像领域的ResNet、自然语言处理领域的Bert,这些革命性的新技术使得应用效果快速提升。但是,好的模型性能并非无代价的,你会发现,深度学习模型正在变得越来越复杂,网络深度越来越深,模型参数量也在变得越来越多。而这会带来一个现实应用的问题:将这种复杂模型推上线,模型响应速度太慢,当流量大的时候撑不住。知识蒸馏就是目前一种比较流行的解决此类问题的技术方向。一般知识蒸馏采取Teacher-Student模式:将复杂模型作为Teacher,Student模型结转载 2020-05-29 13:56:47 · 302 阅读 · 0 评论 -
【回顾】GBDT、XGBoost、LightGBM原理及对比
本文主要简要的比较了常用的boosting算法的一些区别,从AdaBoost到LightGBM,包括AdaBoost,GBDT,XGBoost,LightGBM四个模型的简单介绍,一步一步从原理到优化对比。AdaBoost概述Adaboost(Adaptive Boosting,自适应增强)算法是一种提升方法,将多个弱分类器,组合成强分类器。它的自适应在于:前一个弱分类器分...原创 2019-10-18 10:10:35 · 861 阅读 · 0 评论