自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (8)
  • 收藏
  • 关注

原创 task6-新闻文本分类-基于深度学习的文本分类-bert

学习目标了解Transformer的原理和基于预训练语言模型(Bert)的词表示 学会Bert的使用,具体包括pretrain和finetune学习bert的前置知识点有点多,我们先把前置的知识点梳理一遍,先上关系图:Attention将有限的注意力集中在重要的信息上,从而节省资源,快速获取最有效的信息。这就是简单的attention is all you need。个人理解:有个图书馆(source),里面有很多的书籍,为了方便管理我们给他们做了标签,形成(标签,书籍)-->(

2020-08-04 15:48:33 490

原创 task5-基于深度学习的新闻文本分类

@[toc]回顾在自然语言处理任务中,主要是两个:1、文本数据的表示。2、模型的选择处理。我们之前使用fasttext就是这两者的结合,他可以很快的训练处词向量,然后用softmax算法进行分类。这其中的所有过程对我们来说是透明的,细节我们都不清楚,所以为了更好的学习,接下来我们学习使用word2vec来训练词向量并使用textRNN或者TextCNN算法实现新闻文本分类效果word2vec的基本概念理解word2vec下面是datawhale给出的解释:本节通过word2ve...

2020-08-03 15:27:25 618

原创 NLP—新闻文本分类比赛—Task1赛题理解

学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路结合datawhale学习小组提出的解决思路,提出自己的解决方案和思路赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题数据由以下几个部分构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选手

2020-07-22 09:22:54 300

原创 Python开发环境搭建

Python开发环境搭建文章目录Python开发环境搭建官网及发行版官方链接Python基本环境安装从官网下载部署:Python数据分析环境数据分析环境Python机器学习环境Python深度学习环境官网及发行版官方链接  Python环境安装。首先附官方链接:Python链接  Anaconda环境安装。首先附官方链接:Anaconda链接  WinPython环境安装。首先附官方链接:WinPython链接Python基本环境安装Python有环境和集成了环境的集成发行版两种,目录附基本开

2020-06-05 11:06:44 214

原创 如何在60天通过PMP考试总结

为了更好的靠近目标,我们需要偶尔停下来回头看看我们的足迹。通过PMP后,我也做一下PMP考试备考的总结。我在一家公司担任一个项目管理者的角色,当时想系统的学习一下项目管理的知识体系,为自己工作上的项目管理提供一些理论性的指导。2019年5月份我决定参加PMP考试,但是后面由于公司项目的进度和各方面的事情,最终拖到七月中旬才真正开始备考。我在五月份购买了PMBOK和汪博士解读两本书,由于我负...

2020-03-11 17:19:54 277

原创 AjaxControlToolkit工具上传文件

有时候我们操作不需要整个页面刷新只需要局部刷新,这样不会占用太大的资源,也提高我们的用户体验。这个时候我们就是用AJAX(阿贾克斯)了,其中AJAX是异步刷新方式,但是网上有很多已经写好的控件直接让我们使用,使用起来十分方便。AjaxControlToolkit是比较出名的Ajax工具包,集合了多种异步工具。下载地址:http://www.nuget.org/packages/AjaxContro

2017-06-10 11:46:51 455

规则引擎Drools.md

2.规则rt引擎概述3. Drools入门案例4. Drools基础语法5.Drools属性学习6.Drools高级语法7.案例。资源来源网络,如有侵权,请联系管理员删除

2020-08-24

Spark高级数据分析

Spark高级数据分析,PDF电子书籍 资源只用于学习,如有版权问题,请联系删除

2018-05-18

Hive编程指南

Hive编程指南,PDF电子书籍 资源只用于学习,如有版权问题,请联系删除

2018-05-18

HBase权威指南中文版

HBase权威指南,PDF电子书籍 资源只用于学习,如有版权问题,请联系删除

2018-05-18

大型万战架构技术书籍汇总

对大型网站的架构进行了深入的分析,简明的讲解了核心原理。大型网站技术架构:核心原理与案例分析、大型网站系统与Java中间件实践、分布式Java应用:基础与实践、大型分布式网站架构设计与实践.带目录书签.完整版、《分布式数据库架构及企业实践--基于Mycat中间件 》

2018-03-13

Hadoop权威指南:大数据的存储和分析

Hadoop权威指南:大数据的存储与分析.第四版全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。 本书是一本权威、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的最新发展和应用,程序员可以从中探索海量数据集的存储和分析,管理员可以从中了解Hadoop集群的安装和运维。

2018-03-13

Elasticsearch顶尖高手系列课程全套

Elasticsearch顶尖高手系列课程全套,有志于往数据库发展的欢迎大家下载

2017-11-28

siege windows版

siege压力测试工具

2017-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除