NLP
文章平均质量分 61
你好,少年
这个作者很懒,什么都没留下…
展开
-
从0开始知识图谱搭建_任务1_text数据导入到 Mysql
最近在学习搭建一个知识图谱,分享一个数据导入到 MySQL的方式。 txt文件数据样例: 方法一: 利用sqlyog工具 创建表,例如:创建了表testkgphone 查询语句见下面的代码块,F9执行。 LOAD DATA LOCAL INFILE 'H:\\BaiduNetdisk\\贪心学院知识图谱风控\\任务18 作业1数据和说明\\hw1\\phone.txt' INTO TABLE testkgphone FIELDS TERMINATED BY ',' LINES TERMINATED原创 2021-01-14 12:39:23 · 295 阅读 · 0 评论 -
paddlehub序列标注任务数据集转化
任务 由“列数据集”转化“行数据集” 即由列标注数据转化为百度PaddleHub平台的nlp序列标注任务的数据集类型 首先,看一下数据样例: 注1:训练集数据格式:单词 \t 词性标签 \n 即每行包含单词及其词性标签,如Jawa NNP 注2:每句话用\n隔开 转换代码 import os from itertools import groupby file = open("Ind_train.txt",encoding="utf-8") sig_data = file.readlines() dic原创 2020-12-02 13:10:30 · 503 阅读 · 0 评论 -
python文件的模式,并进行csv,txt文件类型读写
csv文件 import pandas as pd #读取 df = pd.read_csv("ori.csv") #写入 df.to_csv("save.csv")原创 2020-12-02 12:47:04 · 254 阅读 · 0 评论 -
python制作词频字典
读取txt文件,进行单词统计,制作词频字典 text文件中的数据样例: Namun CC aparat NN yang PRL berjaga VB langsung RB sigap NN dan CC …等等 from collections import Counter #读 File = open("Ind_train.txt",encoding="utf-8") ori_data = File.readlines() File.close() n_list = [] for i in o原创 2020-12-02 12:41:02 · 612 阅读 · 0 评论 -
概率图模型
每天一个知识点 1 概率图模型 用图表示变量之间的相互关系的概率模型。有以下两种: 有向无环图(有向图模型,贝叶斯网络):存在显式的因果关系 无向图(马尔可夫网):变量间存在相关性但难以获得显式因果关系 1. 1 隐马尔科夫模型(HMM Hidden Markov Model) 动态贝叶斯网,是一种著名的有向图模型,用于时序数据建模 (1)变量:xi{x_i}xi:观测变量 yi{y_i}yi:状态变量或称隐变量 (2)含义:xi{x_i}xi的取值仅取决于yi{y_i}yi原创 2020-10-21 22:26:34 · 251 阅读 · 0 评论