自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 大数据组队学习Task05和期中作业

mapreduce

2023-02-28 01:56:05 101

原创 李航《统计学习分析》第一周概念记录

一、知识点整理进程和线程:进程和线程都是一个时间段的描述,是 CPU 工作时间段的描述,不过是颗粒大小不同。进程就是包换上下文切换的程序执行时间总和 = CPU 加载上下文 + CPU 执行 + CPU 保存上下文。线程是共享了进程的上下文环境的更为细小的 CPU 时间段。判别式模型和生成式模型:判别式模型直接学习决策函数 f(X) 或条件概率分布 P(Y|X) 作为预测的模型。往往准确率更高,并且可以简化学习问题。如 k 近邻法/感知机/决策树/最大熵模型/ Logistic 回归/线性判别分析

2020-09-07 02:28:21 204

原创 Task6 基于深度学习的文本分类3

Task6 基于深度学习的文本分类3基于深度学习的文本分类学习目标了解Transformer的原理和基于预训练语言模型(Bert)的词表示学会Bert的使用,具体包括pretrain和finetune文本表示方法Part4Transformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。我们重点关注编码部分。他们结构完全相同,但是并不

2020-08-04 23:26:05 283

原创 Python基础训练营task06:函数与Lambda表达式

函数与Lambda表达式1. 函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:参数是函数返回值是函数函数的定义函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname(parameters): "函数_文档字符串" fu

2020-08-03 05:45:11 179

原创 Python基础入门练习——Task05字典、集合、序列

Python基础入门练习——Task04字典、集合、序列字典练习题dic = { 'python': 95, 'java': 99, 'c': 100 }len(dic) #字典长度为33dic['java'] = 98dic['php'] = 90del dic['c']list(dic.values())[95, 98, 90]list(dic.keys())['python', 'java', 'php']list(dic.i

2020-07-31 23:37:28 193

原创 Datawhale NLP入门:Task5 基于深度学习的文本分类2

Task5 基于深度学习的文本分类2在上一章节,我们通过FastText快速实现了基于深度学习的文本分类模型,但是这个模型并不是最优的。在本章我们将继续深入。基于深度学习的文本分类本章将继续学习基于深度学习的文本分类。学习目标学习Word2Vec的使用和基础原理学习使用TextCNN、TextRNN进行文本表示学习使用HAN网络结构完成文本分类文本表示方法 Part3词向量本节通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每

2020-07-31 22:21:45 175

原创 Python入门基础Task04:列表、元组、字符串

Python入门基础Task04:列表、元组、字符串列表习题练习题:列表lst = [2, 5, 6, 7, 8, 9, 2, 9, 9]lst[2, 5, 6, 7, 8, 9, 2, 9, 9]在列表的末尾增加元素15# 直接加lst = [2, 5, 6, 7, 8, 9, 2, 9, 9, 15]lst[2, 5, 6, 7, 8, 9, 2, 9, 9, 15]# 用appendlst.append(15)lst[2, 5, 6, 7, 8, 9, 2

2020-07-28 23:55:51 269

原创 fasttext pip安装失败:No module named fasttext? ERROR: Command errored out with exit status 1 的解决方案

fasttext pip安装失败:No module named fasttext? ERROR: Command errored out with exit status 1 的解决方案今天想用Fasttext做文本训练,import的时候发现这个包包需要外部来安装,木的这个module!报错信息为:No module named ‘fasttext’于是我们乖乖的用pip老人家来安装,得到报错信息如下:报错信息: ERROR: Command errored out with exit

2020-07-28 00:41:01 4053 3

原创 Datewhale NLP 天池比赛:Task4

Task 04import pandas as pdfrom sklearn.metrics import f1_score# 转换为FastText需要的格式train_df = pd.read_csv('train_set.csv', sep='\t', nrows=15000)train_df['label_ft'] = '__label__' + train_df['label'].astype(str)train_df[['text','label_ft']].iloc[:-5000

2020-07-27 23:56:24 151

原创 DataWhale Python基础——task1

Datawhale Python基础训练营作业(1)变量、运算符与数据类型注释# 我是一个python的注释!我是绿色的!"""我是多行注释,我是红色的!"""'\n我是多行注释,我是红色的!\n'运算符算术运算符print(1+1) #加法2print(1*1)#乘法1print(1-1)#减法0print(3/2)#除法1.5print(3//2)#整除(地板除)1print(3%4)#取余3print(3**3) #幂27

2020-07-22 23:53:38 128

原创 Datawhale零基础入门NLP赛事Task 02: 数据读取与数据分析

Datawhale零基础入门NLP赛事Task 02: 数据读取与数据分析今天开始第二个task,要用数据进行实操了呢!首先按照比赛要求准备好响应的库,然后就可以开始了。今天主要用到的库:Pandas学习目标学习使用pandas读取赛题数据分析赛题数据的分布规律数据读取import pandas as pd #首先把pandas导入进来news_label = {'科技': 0, '股票': 1, '体育': 2, '娱乐': 3, '时政': 4, '社会': 5, '教育': 6

2020-07-22 22:47:01 141

原创 Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)

这里写自定义目录标题Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)一、赛题背景二、赛制说明三、赛题数据四、 评测标准五、结果提交六、 专题学习资料七、解题思路Datawhale零基础入门NLP——新闻文本分类(一)熟悉赛题(天池比赛)一、赛题背景这次是第三场赛事,赛事名称为零基础入门NLP之新闻文本分类挑战赛。背景:自然语言处理目的:根据新闻文本字符对新闻的类别分类目标:接触预处理、模型构建和模型训练等知识点二、赛制说明本次赛事分为两个阶段:正式赛(7.

2020-07-21 23:43:30 352

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除