python
WBwhiteBeard
认真
展开
-
Python中元组和列表的区别
Python的元组:str1 = ("abc", 2, 3)str2 = tuple()Python的列表:str1 = [1, 2, 3, 4]str2 = list()二者可以相互转化。基本都是一种数据结构,用来线性的存储数据。区别在于元组的数据无法修改,只能通过转化为列表来进行修改。...原创 2021-06-24 11:22:44 · 186 阅读 · 0 评论 -
Python:ValueError: expected sequence of length 449 at dim 1 (got 471)
原始数据:dims = [[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 6原创 2021-05-07 23:19:07 · 4309 阅读 · 0 评论 -
Python:字典排序,其值为二维数组
参考博客链接:https://blog.csdn.net/cxcxrs/article/details/82459800res = {'业绩下滑': [749, 0.020265151515151514], '提现困难': [640, 0.017316017316017316], '交易违规': [1846, 0.049945887445887446], '失联跑路': [340, 0.0091991341991342], '涉嫌违法': [1272, 0.03441558441558441], '原创 2021-01-13 21:03:15 · 656 阅读 · 0 评论 -
ValueError: color kwarg must have one color per dataset
在画直方图的时候出现了这个问题。我最开始的代码如下:import matplotlib.pyplot as pltplt.hist(x=train.content_type, bins=len(labels_1), color="steelblue", edgecolor='black')plt.xlabel('事件类型')plt.ylabel('频数')plt.show()这个问题是 x=train.content_type 作为参数传进去的时候,其label(1,2,3....)原创 2020-12-25 13:39:17 · 3501 阅读 · 0 评论 -
记一次使用 Pandas.DataFrame.sample
首先我的目标是将一个.csv文件中的内容给分割开来。分为训练集与测试集。但是折腾了一天,才发现有更加简单的方法实现。使用pandas包。train.to_csv('the_train.csv', encoding='utf_8_sig', sep='\t', header=None)# 测试集test = train.sample(frac=0.1, replace=False, random_state=5, axis=0)# 训练集,余下的数据作为训练集train = tra原创 2020-11-24 19:52:46 · 326 阅读 · 0 评论 -
Pandas.DataFrame.sample学习
参考资料:pandas.DataFrame.sample - pandas 0.23.1 documentationpandas.pydata.org转载自:https://zhuanlan.zhihu.com/p/38255793DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)从一列/行数据里返回指定数量的随机样本。常用的几个参数解释:n: ...转载 2020-11-24 19:45:43 · 488 阅读 · 0 评论 -
pandas的to_csv保存文件乱码
train.to_csv('train.csv', encoding='utf_8_sig',index=None)中间加入 encoding='utf_8_sig'或者'utf_8'。原创 2020-11-24 13:47:37 · 170 阅读 · 0 评论 -
pandas保存csv文件去除索引
train.to_csv('train.csv', encoding='utf_8_sig',index=None)在后面加上一个 index = None就行。原创 2020-11-24 13:36:14 · 3155 阅读 · 2 评论 -
Python:关于logging的使用
关于logging的占位符的使用。logging.info("错误信息,占位符1{},占位符2{}", 参数1, 参数2)但是如果是这种呢?logging.info(f"Loading features from cached file {cached_features_file} [took %.3f s]", time.time() - start)Python里面的描述:import logginglogger = logging.getLogger(__name__原创 2020-10-29 18:01:57 · 961 阅读 · 0 评论 -
SyntaxError: Non-UTF-8 code starting with ‘\xc4‘ in file torch_bert.py on line 3
SyntaxError: Non-UTF-8 code starting with '\xc4' in file torch_bert.py on line 3, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details解决办法:在首行加入编码# -*- coding: gbk -*-后面就解决了。原创 2020-09-28 16:28:31 · 408 阅读 · 0 评论 -
TypeError: the JSON object must be str, bytes or bytearray, not dict
样例:{'受理法院': '四川省乐山市中级人民法院', 'event_type': '破产清算', 'event_id': '4758105', '公司名称': '乐山乐电天威硅业科技有限责任公司'}问题:TypeError:JSON对象必须是str,bytes或bytearray,而不是'dict'开始的代码:# 直接对该字段进行解析data1 = json.loads(data['events'][0])修改后的代码:加入 json.dumps()json.load.原创 2020-08-24 11:14:59 · 7119 阅读 · 0 评论 -
python 读取TXT文档中json格式
TXT文本存储文字以行数存储的:换行一下,更加直观。代码如下:train_txt = open("./data/ex1.txt", "r", encoding="UTF-8")lines = train_txt.readlines()print(lines[0])line_1 = lines[0]data = json.loads(line_1)print(type(data))# 结果:<class 'dict'>for line in data:原创 2020-08-24 10:14:35 · 2765 阅读 · 0 评论 -
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9a in position 27: illegal multibyte sequence
python读取文件时报错。源代码train_txt = open("./data/ex1.txt", "r")解决办法1:加上 UTF-8 说明train_txt = open("./data/ex1.txt", "r", encoding="UTF-8")解决办法2:train_txt = open("./data/ex1.txt", "rb")但是这个会导致编码是进制格式展示...原创 2020-08-24 09:36:54 · 372 阅读 · 0 评论 -
Python:初始化一个数组,设置固定长度
1.使用for循环N = 100b = [0 for _ in range(N)]b = [None for _ in range(N)]2.直接乘法N = 100b = [0] * 100b = [None] * 100注意:个人觉得初始化为 None 会更好,毕竟为空值。原创 2020-07-31 08:47:34 · 19456 阅读 · 0 评论 -
TypeError: getNext() takes 0 positional arguments but 1 was given
报错:TypeError: getNext() takes 0 positional arguments but 1 was given原因:定义类的时候,少了一个self参数def getNext(): return self.next添加一个:def getNext(self): return self.next原创 2020-07-30 14:44:35 · 1482 阅读 · 0 评论 -
python: 求数组的行列大小
获取数组行列的大小:1.普通数组以二维数组为例:arr = [[1, 2, 4], [2, 3, 6], [3, 4, 7], [4, 5, 8], [5, 7, 9]]# 行的大小row = len(arr)#列的大小col = len(arr[0])其他维度推理都是len(arr[i])2.numpy形成的数组这个时候就要用到shape函数一维长度:arr.shape[0]二维长度:a..原创 2020-07-30 10:57:02 · 9349 阅读 · 0 评论 -
TypeError: list indices must be integers or slices, not float
原因:说明中间传递参数中有浮点数。这是刚刚写的代码中的错误我的代码:mid = (low+high)/2 # 如果计算数字是4.5,mid = 5guess = list[mid]改正后的代码:mid = (low+high)//2 # 如果计算数字是4.5,mid = 5guess = list[mid]...原创 2020-07-20 15:25:58 · 3251 阅读 · 0 评论 -
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 512
代码片段:import pandas as pdimport csvChinese_stop_words = pd.read_csv("./stop_words.txt", sep='\t', header=None, quoting=csv.QUOTE_NONE, encoding='utf-8')print(Chinese_stop_words)解决办法:出现这种错误:加上import csv,再加上quoting=csv.QUOTE_NONE结果:...原创 2020-07-20 15:20:34 · 2309 阅读 · 0 评论 -
pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 836, saw 2
原因:分隔符设置错误方法:尝试设置delimiter='\t',还有sep=’’注意:需要研究pandas读取文件时存在的注意事项。原创 2020-07-20 15:16:40 · 3405 阅读 · 0 评论 -
mininet和python脚本运行出错:invalid topo name
最近在做静态路由转发实验(计算机网络课程实验),实验课程给出了一定的代码,不过老师在实验上挖了一些坑需要我们填补。先贴出实验代码:#!/usr/bin/pythonfrom mininet.topo import Topofrom mininet.net import Mininetfrom mininet.cli import CLIclass RouterTopo(Top...原创 2019-05-30 10:14:35 · 2255 阅读 · 0 评论 -
python:模组与参数变量
from sys import argvscript,first,second,third = argvprint("the script is called:", script)print("the first variable is:", first)print("the second variable is:", second)print("the third variable...原创 2019-04-17 08:49:32 · 237 阅读 · 0 评论 -
python:I/O操作
文件读取:f = open(r'文件目录','文件操作')例:f = open(r'c:\text\qiye.txt','r')由于文件操作可能会出现IO异常,一旦出现IO异常,后面的close()方法就不会调用。为了保证程序的健壮性,我们需要使用try...finally来实现。try: f = open(r'C:\text\qiye.txt','r') pri...原创 2019-04-10 09:40:42 · 387 阅读 · 0 评论