自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 数据库慕课学习

第一课,数据模型概念模型用ER图表示第二课,关系数据模型

2019-08-03 14:53:35 169

原创 数据库知识点总结

一、基本概念1、数据库服务器 我们可以理解为数据库服务器即是一台内存较高的计算机,可以在上面运行数据库管理软件 2、数据库管理系统 如Mysql,是一个软件,用来管理数据库的软件 3、数据库 即文件夹,用来组织文件 4、表 即文件,用来存放多条记录,每条记录为多个字段组成的一行数据 二、Mysql基本介绍Mysql是目前WEB应用最好的RDBMS(Relati...

2019-08-03 10:05:00 136

原创 TSVD

1、含义:截断奇异值分解(Truncated singular value decomposition,TSVD)是一种矩阵因式分解(factorization)技术,将矩阵 M 分解成 U , Σ 和 V 。TruncatedSVD是SVD的变形,只计算用户指定的最大的K个奇异值。TSVD与一般SVD不同的是它可以产生一个指定维度的分解矩阵。例如,有一个矩阵,通过SVD分解后仍然是一个矩阵,而T...

2018-12-17 16:31:00 6578

原创 TF-IDF和TruncatedSVD

一、使用TF-IDF对文本进行预处理,将文本化为向量的表示形式 1、TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型(如LSI),文本搜索排序等一系列应用奠定基础。2、实例    tfidf_model = TfidfVectorizer().fit(document)  #字典中词语对应的编号    print(tfid...

2018-12-16 11:33:35 1468

原创 python中的fit_transform()函数和transform()函数

# 标准化数据,保证每个维度的特征数据方差为1,均值为0,使得预测结果不会被某些维度过大的特征值而主导1、fit_transform()函数即fit_transform()的作用就是先拟合数据,然后转化它将其转化为标准形式2、transform()函数即tranform()的作用是通过找中心和缩放等实现标准化到了这里,我们似乎知道了两者的一些差别,就像名字上的不同,前者多了一个...

2018-12-15 21:33:34 5567 1

原创 使用Sklearn-train_test_split 划分数据集

使用Sklearn-train_test_split 划分数据集使用sklearn.model_selection.train_test_split可以在数据集上随机划分出一定比例的训练集和测试集1.使用形式为: X_train, X_test, y_train, y_test = train_test_split(train_data,train_target,test_size=0...

2018-12-15 20:40:31 1381

转载 Pandas处理缺失数据

Pandas处理缺失数据利用pandas.DataFrame.dropna处理含有缺失值的数据1.使用形式:DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)功能:处理含有缺失值的dataframe,将缺失值的行列过滤2.参数解释:参数:axis : 确定过滤行还是列,默认为...

2018-12-15 20:21:49 152

原创 lambda

一个用来构造函数的工具 基本上,Python的lambda是用于构造函数(或更精确地说,函数对象)的工具。这意味着,Python有两个构造函数的工具:def和lambda。下面是一个例子。您可以以正常的方式用def构造一个函数,就像def square_root(x):       return math.sqrt(x)或者你可以用lambdasquare_root = lam...

2018-12-15 20:01:43 1761

原创 jieba学习

1、jieba分词的三种模式精确模式:把文本精确的分开,不存在冗余单词全模式:把文本中所有可能的词语都扫描出来,有冗余搜索引擎模式:在精确模式基础上,对长词再次切分2、jieba.cut: def cut(self, sentence, cut_all=False, HMM=True)    (默认cut_all=False, HMM=True)               ...

2018-12-15 19:40:33 211

原创 python 基础语法学习笔记

 一、split函数含义:将一个字符串分裂成多个字符串组成的列表。split()当不带参数时以空格进行分割,当代参数时,以该参数进行分割。//---当不带参数时,默认是以空格作为参数,不管空格在哪,或者有几个空格都被去掉!example:st0= '   song    huan     gong    'print(st0.split())结果为:['song',...

2018-12-15 14:24:19 158

原创 1、Initializing from file failed 2、 'sep' is an invalid keyword argument for this function

1、最开始遇到Initializing from file failed  发现问题后是因为当你用pandas读取文件报这种错误时,一般是因为你的文件名中带有中文这种情况就会报错,只需要这样更改就可以但是改完又出现了  2、 'sep' is an invalid keyword argument for this function   因为没有在sep是在pandas函数...

2018-12-11 09:28:35 843

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除