自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 .split()的妙用:数值字符串类转换成数值类

众所周知,当遇到一个字符串的时候,.split()函数是非常常见的,那么,其实我在用这个函数之前也不知道这是干嘛用的,只是看到许多人在博客里写过。之前发现了一个特别难受的一个问题,就是!!!我之前读取一个txt文件,也就是这玩意。它里面是长这样的。我在读取txt文件的时候,读取出来的数据看似正常,也都是一行一行读出来的数据,可是当时将其转换成np结构的时候,使用shape函数一看,是(1...

2019-09-03 12:10:53 6317

原创 如何处理一个文本数据集

目前有大量的数据集,但是不一定每个数据集对于你来说是一上手就可以使用的。而数据预处理对于一个文本分类的结果来说,是非常重要的。目前我记录一下我的数据预处理的一些方式:文本数据集有许多的不同的语种,就目前而言,中文,英文这些相对使用量大的语言,那么这样就分为大语种和小语种有不同的处理方式了。大语种的话现在已经有许多停用词表,像类似的套路就是:1 中文先分词,分词后使用停用词表将部分无效词语去除...

2019-07-03 17:06:11 1754

原创 python中数组下标为-1

output = [[1,2,3], [4,5,6], [2, 5, 6]]print(output[-1])以这个为例,输出output[-1]的值,[2, 5, 6]是结果,则表示,下标为-1表示输出数组的最后一行数据值用法:当有时候弄不清数组的最后一组数据的时候,可以用这个方法。例如def lstm(inputs): cell...

2019-03-14 15:11:53 20324

原创 拟合正弦函数

神经网络模拟思路:1 构建数据集 :通过np.linspace(a,b,c)来构建一个从a到b中取c个数。再用np.reshape(a,(b,c))改变输入数据x的矩阵形状,a表示的是哪个数据被改变,(b,c)是将其改变成这样形状的矩阵2 创建神经网络模型参数部分 :首先定好参数,再将神经元中的权值和偏重全部定义好3 进行训练 : 调用生成函数,建立占位符(一般在train函数上生成占位符...

2019-01-07 16:55:29 7347

原创 波士顿房价预测神经网络模拟

def load_data(): from sklearn.datasets import load_boston from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split import numpy as np d...

2019-01-05 21:37:38 3634

转载 tf.cast\tf.argmax\tf.argmin

tf.cast()tf.cast()的作用是将一个张量的类型改变为另外一个类型,如第11行,将浮点型转化为整数型def cast(x, dtype, name=None): """Casts a tensor to a new type. The operation casts `x` (in case of `Tensor`) or `x.values` (in case ...

2019-01-04 20:33:00 200

原创 opencc将繁体转换成简体

打开cmd,将目录文件cd(转到)至opencc的文件夹目录下,输入两个命令 -i和-o-i 是输入的文件-o 是输出的文件这样即可创建简体字的文件

2018-11-28 14:53:34 681

原创 python中将一行代码放在for循环那行

s.split() for s in raw_sentences相当于for s in raw_sentences: s.split()只是这么写方便一点

2018-11-28 13:34:09 30323 1

原创 python如何画散点图

在import matplotlib.pyplot进行调用以下面的图片为例使用plt的scatter函数,这个是画散点图的函数plt.scatter(beer["sodium"], beer["cost"],c=colors[beer["cluster"]])plt.scatter(centers.sodium, centers.cost, linewidths=3, marker='...

2018-11-20 20:50:14 7488 1

转载 python中读取文件

sep : str, default ‘,’指定分隔符。如果不指定参数,则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子:’\r\t’beer = pd.read_csv('data.txt',sep=' ')将空格视作分隔符,这个要根据数据的情况而定之后再慢慢补充~...

2018-11-20 19:51:59 722

转载 matplotlib.plt.subplot()用法

在matplotlib下,一个Figure对象可以包含多个子图(Axes),可以使用subplot()快速绘制,其调用形式如下:subplot(numRows, numCols, plotNum)图表的整个绘图区域被分成numRows行和numCols列,plotNum参数指定创建的Axes对象所在的区域,如何理解呢?如果numRows = 3,numCols = 2,那整个绘制图表样式为3X...

2018-11-19 16:06:18 9212

转载 enumerate用法

enumerate是python的内置函数,enumerate在for循环中得到计数的用法,enumerate的参数为可迭代对象,如字符串,列表等,返回的是enumerate的类。用法如下:有一个列表 li = [‘a’,‘b’,‘c’,‘d’]1.# enumerate可以既遍历出索引,又遍历出元素for index,item in enumerate(li):print(index,...

2018-11-19 15:39:21 373

原创 贝叶斯任务代码笔记

贝叶斯代码任务笔记4.1 在3.1的基础上,完成选取所有词中前5000个出现频率最高的词为字典构造TF-IDF特征矩阵,然后训练模型def get_ti_idf(features,top_k=5000): tfidf = TfidfVectorizer(token_pattern=r"(?u)\b\w\w+\b", stop_words=stopwords,max_features=...

2018-11-13 16:20:05 256

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除