![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 61
你好,少年
这个作者很懒,什么都没留下…
展开
-
从0开始知识图谱搭建_任务1_text数据导入到 Mysql
最近在学习搭建一个知识图谱,分享一个数据导入到MySQL的方式。txt文件数据样例:方法一: 利用sqlyog工具创建表,例如:创建了表testkgphone 查询语句见下面的代码块,F9执行。LOAD DATA LOCAL INFILE 'H:\\BaiduNetdisk\\贪心学院知识图谱风控\\任务18 作业1数据和说明\\hw1\\phone.txt'INTO TABLE testkgphoneFIELDS TERMINATED BY ',' LINES TERMINATED原创 2021-01-14 12:39:23 · 282 阅读 · 0 评论 -
paddlehub序列标注任务数据集转化
任务由“列数据集”转化“行数据集”即由列标注数据转化为百度PaddleHub平台的nlp序列标注任务的数据集类型首先,看一下数据样例:注1:训练集数据格式:单词 \t 词性标签 \n即每行包含单词及其词性标签,如Jawa NNP注2:每句话用\n隔开转换代码import osfrom itertools import groupbyfile = open("Ind_train.txt",encoding="utf-8")sig_data = file.readlines()dic原创 2020-12-02 13:10:30 · 478 阅读 · 0 评论 -
python文件的模式,并进行csv,txt文件类型读写
csv文件import pandas as pd#读取df = pd.read_csv("ori.csv")#写入df.to_csv("save.csv")原创 2020-12-02 12:47:04 · 231 阅读 · 0 评论 -
python制作词频字典
读取txt文件,进行单词统计,制作词频字典text文件中的数据样例:Namun CCaparat NNyang PRLberjaga VBlangsung RBsigap NNdan CC…等等from collections import Counter#读File = open("Ind_train.txt",encoding="utf-8")ori_data = File.readlines()File.close()n_list = []for i in o原创 2020-12-02 12:41:02 · 607 阅读 · 0 评论 -
概率图模型
每天一个知识点1 概率图模型用图表示变量之间的相互关系的概率模型。有以下两种:有向无环图(有向图模型,贝叶斯网络):存在显式的因果关系无向图(马尔可夫网):变量间存在相关性但难以获得显式因果关系1. 1 隐马尔科夫模型(HMM Hidden Markov Model)动态贝叶斯网,是一种著名的有向图模型,用于时序数据建模(1)变量:xi{x_i}xi:观测变量 yi{y_i}yi:状态变量或称隐变量(2)含义:xi{x_i}xi的取值仅取决于yi{y_i}yi原创 2020-10-21 22:26:34 · 238 阅读 · 0 评论