- 博客(6)
- 收藏
- 关注
原创 谷歌开源Bert源码解读(偏架构)
BERTLanguage Understanding)是谷歌在2018年推出的一款预训练模型,在情感分析、问答系统、机器翻译、命名实体识别应用广泛。其模型架构是基于12层transformer中Encoder结构,因attention机制考虑到前、后词,所以是双向编码(decoder中的attention只关注到前边的词,是单向的)。
2023-02-05 00:04:54
1199
转载 Beam Search介绍与代码梳理(transformer、tensor2tensor)
最近在学transformer,tensor2tensor库中用了beam search(束搜索),了解了下束搜索的原理,但是实现中还是有很多细节问题需要梳理。
2023-01-26 19:19:34
3313
原创 python用mysql.connector连接虚拟机的mysql数据库
本文主要内容:使用mysql.connector连接数据库查找mysql的ip地址和端口号一、import mysql.connector #导入mysql的包conn = mysql.connector.connect(host='xxx',port=3306,user='root',password='xxx',database='xxx')#连接数据库cursor=conn.cursor(buffered=True) #开启缓存区cursor.execute('select *
2020-09-14 22:57:05
1709
1
原创 sqoop/Hive/impala shell/Hadoop的初接触
sqoop用于关系型数据库与Hadoop之间数据传输的工具导入数据:将My SQL/Oracle数据导入到Hadoop中的HDFS、HBase、Hive中导出数据:将Hadoop中的数据导出到My SQL1.将部分查询到的My SQL数据导入到HDFS里sqoop import \--connect jdbc:mysql://地址/数据库名 \ #连接My SQL--username root\--password 000000\--target dir- /目录/ #要导入到HDF
2020-07-27 21:46:20
370
原创 SQL回顾学习与数据清洗基础操作
SQL基本语法的回顾学习与数据清洗基础操作SQL语句执行顺序from #选择库where #限定条件group by #分组聚合函数 #count sum max等having #后续筛选selectorder bylimitunoin #将查询结果放一起SQL基本语法use 库名show tables #显示库里的表desc 表名 #显示表里的字段及类型select from whereleft join\joinorder by #默认升序limit
2020-07-21 21:31:46
289
原创 自然语言处理算法之TF-IDF
1)Term FrequencyTF(w)=某网页上关键词出现的频率/该网页的总词数2)Inverse Document FrequencyIDF=log(D/Dw),其中D为网页的总数,Dw为出现关键词的网页数最后网页与关键词的相关性=TFw*IDFw越大越相关该算法还可以做关键词提取,文本相似性(余弦相似度),搜索,文献分类等,但是无法处理一词多义、一意多词的现象。...
2019-04-15 17:41:21
153
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人