自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 谷歌开源Bert源码解读(偏架构)

BERTLanguage Understanding)是谷歌在2018年推出的一款预训练模型,在情感分析、问答系统、机器翻译、命名实体识别应用广泛。其模型架构是基于12层transformer中Encoder结构,因attention机制考虑到前、后词,所以是双向编码(decoder中的attention只关注到前边的词,是单向的)。

2023-02-05 00:04:54 1199

转载 Beam Search介绍与代码梳理(transformer、tensor2tensor)

最近在学transformer,tensor2tensor库中用了beam search(束搜索),了解了下束搜索的原理,但是实现中还是有很多细节问题需要梳理。

2023-01-26 19:19:34 3313

原创 python用mysql.connector连接虚拟机的mysql数据库

本文主要内容:使用mysql.connector连接数据库查找mysql的ip地址和端口号一、import mysql.connector #导入mysql的包conn = mysql.connector.connect(host='xxx',port=3306,user='root',password='xxx',database='xxx')#连接数据库cursor=conn.cursor(buffered=True) #开启缓存区cursor.execute('select *

2020-09-14 22:57:05 1709 1

原创 sqoop/Hive/impala shell/Hadoop的初接触

sqoop用于关系型数据库与Hadoop之间数据传输的工具导入数据:将My SQL/Oracle数据导入到Hadoop中的HDFS、HBase、Hive中导出数据:将Hadoop中的数据导出到My SQL1.将部分查询到的My SQL数据导入到HDFS里sqoop import \--connect jdbc:mysql://地址/数据库名 \ #连接My SQL--username root\--password 000000\--target dir- /目录/ #要导入到HDF

2020-07-27 21:46:20 370

原创 SQL回顾学习与数据清洗基础操作

SQL基本语法的回顾学习与数据清洗基础操作SQL语句执行顺序from #选择库where #限定条件group by #分组聚合函数 #count sum max等having #后续筛选selectorder bylimitunoin #将查询结果放一起SQL基本语法use 库名show tables #显示库里的表desc 表名 #显示表里的字段及类型select from whereleft join\joinorder by #默认升序limit

2020-07-21 21:31:46 289

原创 自然语言处理算法之TF-IDF

1)Term FrequencyTF(w)=某网页上关键词出现的频率/该网页的总词数2)Inverse Document FrequencyIDF=log(D/Dw),其中D为网页的总数,Dw为出现关键词的网页数最后网页与关键词的相关性=TFw*IDFw越大越相关该算法还可以做关键词提取,文本相似性(余弦相似度),搜索,文献分类等,但是无法处理一词多义、一意多词的现象。...

2019-04-15 17:41:21 153

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除