python+py清
文章平均质量分 55
大V
fgh431
非淡泊无以明志
展开
-
py rb形式打开文本+AttributeError: ‘str‘ object has no attribute ‘decode‘
ftrain = open("umich-sentiment-train.txt", 'rb')for line in ftrain: print (type(line)) sentence,label = line.strip().split(b'\t')上代码打开一个txt,居然是用rb格式(虽然你是txt格式)line记住了啊!他应该是字节流的形式吧!注意那个split里面一定要加一个b,因为现在都是字节流啊!...原创 2021-02-25 13:41:45 · 152 阅读 · 0 评论 -
Python enumerate() 函数
Python enumerate() 函数原创 2021-02-21 21:08:43 · 127 阅读 · 0 评论 -
imdb如何从训练集中找出他对应的话语
import keras import numpy as np from keras.datasets import imdb(X_train, y_train), (X_test, y_test) = imdb.load_data()print(X_train.shape)print(y_train.shape)avg_len = list(map(len, X_train))np.mean(avg_len)word2index = imdb.get_word_index().原创 2021-03-15 19:35:37 · 140 阅读 · 0 评论 -
我在我的base_tensorflow环境下安装jieba
文章目录我就直接在df下载了结巴然后放到D:\software\Anaconda3\envs\base_tensorflow\Lib\site-packages 再然后解压然后激活anaconda prompt激活base_tensorflow到那个目录下,执行OK了!原创 2021-02-17 22:14:01 · 349 阅读 · 0 评论 -
TS2搭建两种损失函数隐层的softmax实现手写数字分类
import numpy as npdef getRandomIndex(n, x): # 索引范围为[0, n),随机选x个不重复,注意replace=False才是不重复,replace=True则有可能重复 index = np.random.choice(np.arange(n), size=x, replace=False) return indexfrom keras.datasets import mnistfrom keras...原创 2021-01-17 10:40:41 · 223 阅读 · 3 评论 -
把刘德华的RGB的RG全部清零+显示成灰度图啊
import matplotlib.pyplot as pltimport numpy as npimg = plt.imread("0.png")img[:,:,0]= np.zeros(img[:,:,0].shape)img[:,:,1]= np.zeros(img[:,:,0].shape)b = img[:,:,2]plt.imsave('00.png',img)ee原创 2021-01-15 00:07:48 · 205 阅读 · 0 评论 -
我的conda的环境的几个ts版本
时光过得真快,我的电脑上有好几个anaconda环境似乎每个环境下面都有tensorflow我就是看看哪个环境下的tensorflow是2.几版本的呢import tensorflow as tfprint (tf.__version__)最后证实了是base_tensorflow那个是2.2.0版本...原创 2021-01-11 13:26:37 · 126 阅读 · 0 评论 -
查看sklearn的版本
文章目录查看sklearn的版本查看sklearn的版本import sklearnsklearn.__version__Out[4]: '0.22.1'原创 2021-01-09 17:46:31 · 6895 阅读 · 0 评论 -
numpy array的矩阵乘+矩阵增加1列
a = np.array([[1,2,3,4],[5,6,7,8]])b = np.array([1,2,3,4])np.matmul(a,b)Out[23]: array([30, 70])原创 2020-12-29 13:57:01 · 335 阅读 · 0 评论 -
怎么安装tushare啊?
打开Anaconda Prompt由于我老忘想在base环境下安装tushare因为这样我直接就在spyder可以用它了我就直接输入pip install tushare这就成功了呢!原创 2020-12-03 15:07:47 · 1644 阅读 · 1 评论 -
tx 让我pandas分类汇总
文章目录pandas分类汇总pandas分类汇总按照b分组import pandas as pddata = pd.read_csv("1.csv")grouped=data.groupby(data['b'])print(grouped.sum())原创 2020-09-08 12:01:14 · 226 阅读 · 0 评论 -
py全局变量
文章目录局部变量和全局变量重名函数内引用全局变量局部变量和全局变量重名n = 1234def count(): n =123 print(n) print(id(n))count();print(id(n));1231407316227975202850916714544函数内引用全局变量n = 1234def count(): global n print(n) print(id(n))count();print(i原创 2020-08-11 13:34:06 · 237 阅读 · 0 评论 -
illegal multibyte sequence
文章目录UnicodeDecodeError: 'gbk' codec can't decode byte 0x9d in position 6927: illegal multibyte sequenceUnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x9d in position 6927: illegal multibyte sequence只需如此即可!!with open("textClassifier/data/rawData/u原创 2020-06-25 07:28:58 · 1943 阅读 · 0 评论 -
求数组的softmax
文章目录求数组的softmax求数组的softmax居然这么牛逼我以前以为数组知道了的化肯定还要知道前面的系数才可以去求softmax import numpy as npa=np.array([4.01,2.01,5.0,3.34])a=np.exp(a)a/sum(a)#这就是softmax数组啊!!...原创 2020-06-24 23:09:33 · 648 阅读 · 0 评论 -
LogisticRegression系列
1. 函数函数的参数含义。IDE中输入help(“函数名”)。直接在ide中调出了官方文档。网上搜sklearn官方文档,在里面找到自己需要的这个函数。from sklearn.linear_model import LogisticRegression as LRhelp(LR)官方文档添加链接描述 ...原创 2020-06-18 20:19:54 · 1020 阅读 · 0 评论 -
声明二维list
声明二维数组dp= [[0] * M for j in range(N+1)]原创 2020-04-17 18:38:48 · 378 阅读 · 0 评论 -
OneHotEncoder没有啥属性
AttributeError: ‘OneHotEncoder’ o has no attribute ‘categories_’解决办法:更新sklearn库1.anaconda的Promote2.pip list 可以查看当前已经安装的包和版本3.更新sklearn输入”conda update scikit-learn” AttributeError: ‘OneHotEncoder’ object has no attribute ‘n_values_’安装指定version的包:原创 2020-06-16 12:59:02 · 2466 阅读 · 0 评论 -
read_csv读pima_data有感
文章目录读法大全只要一个参数header=None读法大全只要一个参数from pandas import read_csvfrom sklearn.model_selection import KFoldfrom sklearn.model_selection import cross_val_scorefrom sklearn.ensemble import BaggingClassifierfrom sklearn.tree import DecisionTreeClassifier原创 2020-06-15 23:57:18 · 247 阅读 · 0 评论 -
sklearn.cross_validation新版本中的替代
sklearn.cross_validation新版本中的替代方法sklearn 0.18及以上的版,sklearn.cross_validation无法导入的情况,新版本中此包被废弃只需将 cross_validation 改为 model_selection包中的函数仍可继续使用。...原创 2020-06-14 22:15:56 · 279 阅读 · 0 评论 -
%时间 %时间it
%time %timeitipython下才可用。(所以说Jupyter Notebook当然是可以用的,pycharm里的python环境也是jupyter Notebook的)%time测量一行代码执行的时间%timeit测量一行代码多次执行的时间 有说法说,%timeit是测量一行代码100000次循环内,3次最快速度的平均值,strings = ['foo', 'foobar', 'baz', 'qux', 'python', 'Guido Van Rossu原创 2020-06-14 13:43:35 · 226 阅读 · 0 评论 -
贪sir负low实战系列
文章目录ts实战关于One-Hot编码实例:Softmax Regression识别手写数字cancits实战使用TensorFlow的4个基本步骤定义算法公式,即神经网络前向计算的公式定义损失函数,选定优化器,并指定优化器优化损失函数迭代地对数据进行训练在测试集或验证集上对准确率进行评测关于One-Hot编码非连续的数据经常也会使用数字进行编码,便于处理。例如“男性”编码为1,“女性”编码为2。但是这二者之间是不存在数学上的连续关系的,然而如果按照上述1和2进原创 2020-06-13 23:20:54 · 381 阅读 · 0 评论 -
tensorflow的一些小函数
tf.placeholdertf.placeholder( dtype, shape=None, name=None)dtype:常用tf.float32,tf.float64等数值类型shape:None,就是一维值,也可多维([2,3], [None, 3]表示列是3,行不定)name:名称 Tensorflow的设计理念称计算流图,编写程序时,先构筑整个系统的graph,代码不直接生效,这一点和python的其他数值计算库(如Numpy)不同gra原创 2020-06-13 15:20:41 · 486 阅读 · 0 评论 -
py字符串作为参数是值传递
py字符串作为参数是值传递def a(b): b='c' print (b) b="dfsdf"a(b)print (b)原创 2020-06-13 15:07:58 · 389 阅读 · 0 评论 -
input_data.read_data_sets出错咋办
文章目录input_data.read_data_sets出错咋办input_data.read_data_sets出错咋办from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets('MNIST_data',one_hot=True)将下面的改成# CVDF mirror of http://yann.lecun.com/exdb/mnist/#DE原创 2020-06-13 13:11:21 · 2167 阅读 · 0 评论 -
spyder系列
spyder的这个是啥作用如果点击了Execute in a dedicated console那么你点击run的时候就新出来一个console原创 2020-06-13 12:13:00 · 937 阅读 · 0 评论 -
py递归遍历文夹o(╥﹏╥)o
os.listdir不能深层遍历,用os.walk解决。parent,dirnames,filenames=os.walk(rootdir)rootdir 是目录路径返回三元组,父目录名称(绝对地址,类型String),父目录下的文件夹名称(不含绝对地址,List 类型),父目录下面的文件名称(不含绝对地址,List 类型)。 看他有几个文件夹:2 个;所以返回两个三元组;第一个三元组Parent= ‘C:\Users\admin\Desktop\1..原创 2020-06-12 16:58:10 · 163 阅读 · 0 评论 -
集必得特
文章目录一、 DT:回归树 Regression Decision Tree二、 GB:梯度迭代 Gradient Boosting三、 GBDT工作过程实例caokanGBDT1.简介2 正式介绍caokanGBDT主要由三概念组成:Regression Decistion Tree(即DT),Gradient Boosting(即GB),Shrinkage (算法的一个重要演进分枝,目前大部分源码都按该版本实现)。搞定这三后就能明白GBDT如何工作,理解它如何用于搜索排序则需要额外理解R原创 2020-06-10 12:51:02 · 285 阅读 · 0 评论 -
word2vec预训练词向量+通俗理解word2vec+CountVectorizer+TfidfVectorizer+tf-idf公式及sklearn中TfidfVectorizer
文章目录sklearn文本特征提取——TfidfVectorizerTFIDFTF-IDF如何使用?参考文献tf-idf公式及sklearn中TfidfVectorizer1 文本向量化特征的不足2. TF-IDF概述3 用scikit-learn进行TF-IDF预处理4. TF-IDF小结联结sklearn文本特征提取——TfidfVectorizer(term frequency-inverse document frequency)处理文本时,如何将文字转化为模型可处理的向量?TF-IDF原创 2020-06-08 09:09:31 · 3310 阅读 · 2 评论 -
kaggle算法XGBoost入及实+梯度提升树参数说明+DictVectorizer使用说明+DataFrame.to_dict()+决策树实战+加载数据集+GBDT实战
文章目录(三)决策树实战一. sklearn决策树参数二. sklearn决策树实战2.1 准备数据及读取2.2 决策树的特征向量化DictVectorizer2.4 决策树训练参考(三)决策树实战sklearn中训练决策树的默认算法是CART,用CART决策树的好处是可以用它来进行回归和分类处理,不过这里我们只进行分类。一. sklearn决策树参数一个模型中很重要的一步是调参。sklearn中,模型的参数是通过方法参数来决定的,以下给出sklearn中,决策树的参数:通常参原创 2020-06-01 12:18:05 · 1407 阅读 · 0 评论 -
pd.DataFrame系列
pd.DataFrame初始化以及set_indeximport pandas as pddf = pd.DataFrame([['a1', 1], ['a2', 4]], columns=['uid', 'score'])print(df)df.set_index('uid',inplace=True);print (df)原创 2020-05-15 17:02:48 · 6688 阅读 · 0 评论 -
anaconda安装pytorch 1.7版本 ,太简单啦!
先搞一个环境,你懂的1conda create -n pytorch --clone baseconda activate pytorch 下面还要设置一下这个!不然就失败!conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/ 安装吧!conda install pytorch torchvision 如果想要在spyder下就再来这个我.原创 2021-01-25 15:02:08 · 3578 阅读 · 0 评论 -
anaconda与tensorflow系列
文章目录如何安装anaconda打开长这样子如何安装anaconda下载网址https://www.anaconda.com/products/individual打开长这样子原来我电脑上已经安装过anaconda了,谢谢!原创 2020-05-15 16:48:00 · 1128 阅读 · 1 评论 -
Python list查找某个值的索引
文章目录Python list查找某个值的索引Python list查找某个值的索引list1.index(target)原创 2020-04-16 01:47:39 · 2366 阅读 · 1 评论 -
Python中单双引号
Python中单引号和双引号Python中单引号或双引号没区别,都可表示一个字符串。但是这两种通用的表达方式,除了可以简化程序员的开发,避免出错之外,还可减少转义字符的使用,是程序看起来更简洁清晰 1、包含单引号的字符串一个字符串my_str,值为: I’m a student,则可用如下方式,通过转义字符 \ 进行定义my_str = ‘I’m a student’也可...原创 2020-04-15 18:37:15 · 610 阅读 · 0 评论 -
python读取控制台输入
py3的inputinput() 是内置函数,从控制台读取用户输入的内容。总是以字符串来处理用户输入,所以用户输入的内容可以包含任何字符。 用法str = input(tipmsg)str 表示一个字符串类型的变量,input 会将读取到的字符串放入 str 中。tipmsg 提示信息,显示在控制台上,告诉用户应该输入什么样的内容;如果不写 tipmsg,就不会有任何...原创 2020-04-15 17:07:19 · 3659 阅读 · 0 评论 -
多维数组的size + numpy随机系列
文章目录吴恩达推荐用这个import numpy as npa=np.random.randn(1,5)原创 2020-03-01 11:06:51 · 1654 阅读 · 0 评论 -
python画图
文章目录# -*- coding: utf-8 -*-import matplotlib.pyplot as pltimport numpy as npplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus'] = FalseX=["344","344","43","","434","...原创 2019-10-09 15:29:51 · 114 阅读 · 0 评论 -
删除列表元素+Python 列表(List)+Python 字典(Dictionary)+python样本权重怎么添加?
student1_dict={1001:"xiaowang",1002:"xiaoli"}student2_dict={"1001":"xiaowang","1002":"xiaoli"}student3_dict=dict([(1001,"xiaowang"),(1002,"xiaoli")])student4_dict=dict(((1001,"xiaowang"),(1002,"xia...原创 2019-08-05 16:10:06 · 778 阅读 · 0 评论 -
8 zz表达shi
文章目录8.2直接用正则表达式模块re处理字符串8.2直接用正则表达式模块re处理字符串标准库re提供正则表达式操作所需要的功能,既可以直接使用re模块中的方法(见表8-3)处理字符串,也可以把模式编译成正则表达式对象再使用(见8.3节) import retext = "alpha. beta...gamma delta"a=re.split('[\. ]+', text)print (a)a=re.split('[\. ]+', text, maxsplit=2)p原创 2020-06-16 17:09:29 · 303 阅读 · 0 评论 -
きゅう :文件内容擦做
文章目录1.文本文件2.二进制文件9.1文件操作基本知识9.1.1内置函数open()9.1.2文件对象属性与常用方法记事本文件、日志文件、配置文件、数据库文件、图像文件、音频和视频文件、可执行文件、 Office文件、动态链接库文件等,都以不同的文件形式存储在各种存储设备(如磁盘、U盘 光盘、云盘、网盘等)上。按数据组织形式,文件分为文本文件和二进制文件两大类1.文本文件文本文件存储的是常规字符串,由若干文本行组成,每行以换行符"\n’结尾。常规字符串是指记事本之类的文本编辑器能正常显示、原创 2020-05-17 09:52:22 · 242 阅读 · 0 评论