- 博客(19)
- 收藏
- 关注
原创 Docker常用命令
docker常用命令帮助命令docker version # 显示docker的版本信息docker info # 显示docker的系统信息,包括镜像和容器的数量docker 命令–help # 帮助命令也可以去官方 reference查看,地址:https://docs.docker.com/engine/reference/commandline/镜像命令docker images 查看所有本地的主机上的镜像【root@kuangshen /】# doc
2020-08-23 16:41:50 189
原创 解决Some index files failed to download, they have been ignored, or old ones used instead.的问题
首先先把/var/lib/apt/lists 的文件备份一下 (养成备份的好习惯)mkdir /var/lib/apt/listcp -r /var/lib/apt/lists/* /var/lib/apt/list然后删除/var/lib/apt/lists/文件夹下所有的文件rm -rf /var/lib/apt/lists/*然后 打开/etc/apt/sources.listvim /etc/apt/sources.list写入阿里源deb http://mirrors.aliyu
2020-08-21 18:05:54 1638
原创 task1分治
多数元素class Solution {public:int majorityElement(vector& nums) {int tar = nums[0], times = 1;for(int i = 1; i < nums.size(); i++){if(times == 0){tar = nums[i];times = 1;}else if(nums[i] != tar)times–;elsetimes++;} return tar;}};最
2020-08-19 21:58:36 123
原创 task6
学习目标了解Transformer的原理和基于预训练语言模型(Bert)的词表示学会Bert的使用,具体包括pretrain和finetune文本表示方法Part4Transformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。我们重点关注编码部分。他们结构完全相同,但是并不共享参数,每一个编码器都可以拆解成两部分。在对输入序列做词的向量化之
2020-08-05 11:13:52 140
原创 Task5
Task5 基于深度学习的文本分类2在上一章节,我们通过FastText快速实现了基于深度学习的文本分类模型,但是这个模型并不是最优的。在本章我们将继续深入。基于深度学习的文本分类本章将继续学习基于深度学习的文本分类。学习目标学习Word2Vec的使用和基础原理学习使用TextCNN、TextRNN进行文本表示学习使用HAN网络结构完成文本分类文本表示方法 Part3词向量本节通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条
2020-07-31 22:35:16 164
原创 天池新闻文本分类-04 基于深度学习的文本分类1
基于深度学习的文本分类与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。学习目标1.学习FastText的使用和基础原理2.学会使用验证集进行调参文本表示方法 part2现有文本表示方法的缺陷在上一章节,我们介绍几种文本表示方法:1.One-hot2.Bag of Words3.N-gram4.TF-IDF也通过sklean进行了相应的实践,相信你也有了初步的认知。但上述方法都或多或少存在一定的问题:转换得到的向
2020-07-27 20:52:55 272
原创 天池新闻文本分类-03基于机器学习的文本分类
在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的文本分类。学习目标1.学会TF-IDF的原理和使用2.使用sklearn的机器学习模型完成文本分类机器学习模型机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。机器学习有很多种分支,对于学习者来说应该优先掌握机器学习算法
2020-07-25 22:49:12 290
原创 天池新闻文本分类-02数据读取与数据分析
一、回顾在上一章节,我们给大家简单介绍了赛题的内容和几种解决方案。从本章开始我们将会逐渐带着大家使用思路1到思路4来完成本次赛题。在讲解工具使用的同时,我们还会讲解一些算法的原理和相关知识点,并会给出一定的参考文献供大家深入学习。二、数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.read_csv('../input/train_set.csv', se
2020-07-22 21:54:29 483
原创 天池新闻文本分类-01赛题理解
一、赛题背景本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第三场 —— 零基础入门NLP之新闻文本分类挑战赛。赛题以自然语言处理为背景,要求选手根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。二、赛题数据赛题以新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育
2020-07-21 16:33:23 368
原创 NLTK入门-常用函数
1.text.concordance(word)这个函数就是用来搜索单词word在text 中出现多的情况,包括出现的那一行,重点强调上下文,实例如下:>>> text1.concordance("monstrous")Displaying 11 of 11 matches:ong the former , one was of a most monstrous size...
2020-05-01 08:26:48 812
原创 处理tuple indices must be integers or slices, not str
x=input()X=(‘零’,‘一’,‘二’,‘三’,‘四’,‘五’,‘六’,‘七’,‘八’,‘九’);for i in x:## 标题print(X[i])在处理这段代码时报出错误是因为i并非整数型,因为input函数获得的输入为字符串型只需将代码改成下面的形式:x=input()X=(‘零’,‘一’,‘二’,‘三’,‘四’,‘五’,‘六’,‘七’,‘八’,‘九’);for i...
2019-10-29 22:49:39 5074
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人