自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 画平滑曲线

import matplotlib.pyplot as pltimport numpy as npfrom scipy.interpolate import *#解决中文显示问题plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus'] = Falsex=[1,2,3,4,5,6,7,8,...

2020-04-15 08:31:12 231

原创 pandas连接表格

import pandas as pdcaozuo= 'D:/caozuo_train.csv'#文件目录caozuosheet = pd.read_csv(caozuo,usecols=['UID','1'])#读取表的哪几列,列表里面是列名jiaoyisheet=pd.read_csv(jiaoyi,usecols=['UID','1'])tagsheet2=pd.merge(c...

2018-11-30 20:13:03 381

原创 求交集小练手

def diff_of_element_list(lst, k): newlst = [i + k for i in lst] print(set(newlst)) print(set(lst)) return set(lst) & set(newlst)#求交集,&求交集if __name__ == '__main__': lst =...

2018-11-30 10:01:41 125

原创 有趣的列表连接

print([i for i in range(11)])print( [i for i in range(5)] )print([i for i in range(3)])print([i for i in range(11)]+[3, 3,3,4, 4, 4])# 划重点:::列表进行连接不是相加

2018-11-30 09:40:49 136

原创 医疗文本的规范化

Adapting Phrase-based Machine Translation to Normalise Medical Terms in Social Media Messageshealth reports in social media, such as DailyStrength and Twitter, have potential (数据来源)然而,为了使机器理解并推断用户...

2018-11-28 21:00:45 576

原创 文本分类在选择机器学习模型时的特征工程

机器学习与深度学习不同,机器学习需要自己构建特征向量,并且不局限于词,这里看到一篇文章讲到一些机器学习构建词向量如下:1.向量空间模型2.LDA的主题词特征提取3.中文多类别情感分类模型中特征选择方法。这篇文章设计了基于朴素贝叶斯分类器、使用布尔权重的中文三类别和五类别情感分类模型。比较常用的特征选择方法有:文档频率(Document Frequency,DF),信息增益(In...

2018-11-28 14:59:18 380

翻译 NLP的迁移模型

Universal Language Model Fine-tuning for Text Classification这篇文章介绍了一个新的NLP领域的迁移模型,文中称ImageNet-like model,文章介绍了ULMFiT并介绍了微调的策略。ULMFi模型     (开源代码http://nlp.fast.ai/ulmfit.) ULMFi模型的微调策略 实验 结果 We...

2018-11-27 17:35:02 541 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除