python
AI强仔
人工智能爱好者、机器人爱好者
展开
-
Jetson安装Anaconda(miniforge3)
miniforge集成了Anaconda的核心工具:conda。conda是一个包和环境管理工具。因此,我下载anaconda安装时报下面错误illegal instruction(core dumped),没安装成功,故安装miniforge了。据说anaconda还没完全支持arm芯片架构。原创 2023-06-24 19:08:46 · 1797 阅读 · 0 评论 -
python时间差:total_seconds()含跨天的时间,而seconds不含跨天时间
total_seconds()含跨天的时间(train_data[‘fault_time’]-train_data[‘time’]).dt.total_seconds()seconds不含跨天时间(train_data[‘fault_time’]-train_data[‘time’]).dt.seconds原创 2022-03-12 15:23:38 · 1883 阅读 · 0 评论 -
python并行运算 Parallel
1.先定义一个准备并行执行的方法def test(args, tokenizer, ids):…return test_samples2. 将数据分成4份,以便4个进程并行ids = df[“id”].unique()ids_splits = np.array_split(ids, 4)#不均等分割,分成4份3. 使用Parallel方法并行运算from joblib import Parallel, delayed#参数n_jobs来设置开启进程数。results = Parallel原创 2022-02-02 17:40:16 · 7010 阅读 · 0 评论 -
python利用difflib判断两个字符串的相似度
difflib是python自带的,所以不需要安装,直接引用即可import difflibratio=difflib.SequenceMatcher(None, str1, str2).ratio()原创 2021-06-23 17:17:38 · 1376 阅读 · 0 评论 -
python 文件夹、文件操作
1.循环读取文件夹下的文件for root,dirs,files in os.walk(r"D:/data/训练集"):for file in files:#获取文件所属目录print(root)#获取文件路径print(os.path.join(root,file))2.获取文件名、后缀filepath, tmpfilename = os.path.split(fileUrl)shotname, extension = os.path.splitext(tmpfilename)...原创 2021-06-10 09:24:30 · 144 阅读 · 2 评论 -
python json操作
1. 读取jsomimport jsonline_dic = json.loads(line)#转成jsonline_dic[‘word’] #读取具体的元素2.写jsonannotation = {“tid”: “”, “title”: “”, “value”: “”}#定义字典,方便转化jsonannotation[‘title’]=‘1’annotation[‘tid’] = ‘主题’annotation[‘value’] = ’具体值‘with open(“E:/test.json原创 2021-06-10 09:16:33 · 156 阅读 · 3 评论 -
pyecharts 仪表盘、漏斗图
1.仪表盘from pyecharts import options as optsfrom pyecharts.charts import Gaugegauge=(Gauge().add("", [("", 76.6)]).set_global_opts(title_opts=opts.TitleOpts(title=“仪表盘”)))gauge.render_notebook()2.漏斗图from pyecharts.charts import Funnel, Pagex_data原创 2021-06-02 17:59:06 · 319 阅读 · 0 评论 -
python pyecharts画中国地图
from pyecharts.charts import Mapprovinces = [“广东”, “北京”, “上海”, “辽宁”, “湖南”, “安徽”,“四川”]value = [300, 100, 2000, 800, 10000, 400, 5000]c = (Map().add("", [list(z) for z in zip(provinces, value)], “china”).set_global_opts(title_opts=opts.TitleOpts(title=原创 2021-06-02 17:29:02 · 1025 阅读 · 0 评论 -
python seaborn 热图
import seaborn as snsnp.random.seed(0)x=[[0.21,0.52,0.23,0.22,0.36],[0.12,0.7,0.35,0.21,0.55],[0.31,0.5,0.34,0.45,0.1],[0.38,0.2,0.65,0.26,0.44],]f, (ax1) = plt.subplots(figsize=(6,6),nrows=1)sns.heatmap(x, annot=True, ax=ax1)原创 2021-06-02 17:04:21 · 140 阅读 · 0 评论 -
python WordCloud制作词云
1. 代码from wordcloud import WordCloudimport matplotlib.pyplot as pltimport numpy as npfrom PIL import Image#打开文本text = open(‘E:/python_test/test.txt’,‘r’, encoding=‘UTF-8’).read()#生成对象 width=1800, height=1600,wc = WordCloud(font_path=‘E:/python_test原创 2021-06-02 16:56:04 · 359 阅读 · 0 评论 -
python写入与读取txt、tsv、csv、excel等文件
1.1读取txtvocabs=[]with open(“D:/vocab_init.txt”, “r”) as f:for line in f.readlines():line = line.strip(’\n’) #去掉列表中每一个元素的换行符#print(line)vocabs.append(line)1.2 写入txtfinal_vocabs = [‘1’,‘2’]file = open(‘D:/vocab.txt’, ‘w’)for i in range(len(final_v原创 2021-04-03 15:20:15 · 2169 阅读 · 0 评论 -
tf.keras神经网络模型定义多个输入
1.多个输入数据构造final_train_tokens=[]#输入1final_train_poss=[]#输入2final_train_labels=[]#标签train_dataset = tf.data.Dataset.from_tensor_slices((final_train_tokens,final_train_poss))dataset2 = tf.data.Dataset.from_tensor_slices(final_train_labels)train_dataset原创 2021-03-04 23:12:17 · 1385 阅读 · 1 评论 -
int8 int16 int32 int64 float16 float32
int8取值范围是-128 - 127Int16 意思是16位整数(16bit integer),相当于short 占2个字节 -32768 ~ 32767Int32 意思是32位整数(32bit integer), 相当于 int 占4个字节 -2147483648 ~ 2147483647Int64 意思是64位整数(64bit interger), 相当于 long long 占8个字节 -9223372036854775808 ~ 92233720368547原创 2020-12-05 21:13:58 · 10357 阅读 · 0 评论 -
Pandas的concat,merge,join和append区别
Pandas提供了concat,merge,join和append四种方法用于dataframe的拼接,其区别如下:concat两个DataFrame通过pd.concat(),既可实现行拼接又可实现列拼接,默认axis=0,join=‘outer’。表df1和df2的行索引(index)和列索引(columns)均可以重复。 a. 当axis=0(行拼接)时,使用pd.concat([df1,df2]),拼接表的index=index(df1) + index(df2),拼接表的columns=co原创 2020-11-27 11:00:37 · 2054 阅读 · 0 评论 -
DataFrame、pandas方法总结
columns获取所有的列for col in X.columns:按条件读取下面是读取列content_type_id 等于 False的数据。train_user_questions = train[train.content_type_id == False]nunique获取每列或某列的distinct数有多少,即每列去重后有多少个数据nunique = X.nunique()dtypes每列类型,比如int16等。types = X.dtypeslen数据长度:len(原创 2020-11-10 09:48:47 · 1167 阅读 · 0 评论 -
jupyter忘记密码重置密码
step 1:终端输入jupyter notebook --generate -configstep 2:终端输入jupyter notebook password # 按提示,输入密码原创 2020-11-02 11:29:44 · 5659 阅读 · 0 评论 -
pycharm没显示plt图片
1.pycharm没显示plt图片,加下下面内容试试。plt.show()原创 2020-09-21 11:55:10 · 853 阅读 · 0 评论 -
pyx、pyd、so
.pyx 文件是由 Cython 编程语言 “编写” 而成的 Python 扩展模块源代码文件。.pyx 文件类似于 C 语言的 .c 源代码文件,.pyx 文件中有 Cython 模块的源代码。不像 Python 语言可直接解释使用的 .py 文件,.pyx 文件必须先被编译成 .c 文件,再编译成 .pyd (Windows 平台) 或 .so (Linux 平台) 文件,才可作为模块 import 导入使用...原创 2020-08-18 08:49:49 · 562 阅读 · 0 评论 -
cv2函数方法大全
目录1 cv2.imread(): 12 cv2.imshow()显示图像 13 cv2.imwrite(file,img,num): 14 Img基本属性 15 图片颜色通道的分离与合并 16 图片相加、加减乘除、均值&方差、逻辑运算——与、或、非、异或 17 cv2.flip(img,flipcode)翻转图像 28 cv2.resize()缩放等几何变换 39 形态学转换 310 绘制线段,圆,矩形和多边形等 311 cvtColor颜色空间转换 312 二值化 41原创 2020-07-31 11:24:18 · 14318 阅读 · 2 评论 -
python图像增强工具imgaug
1.简介:https://github.com/aleju/imgaugimgaug是一个封装好的用来进行图像augmentation的python库2.增强操作类型Fliplr:水平翻转Flipud:纵向翻转CropAndPad:裁剪图片Affine:变形操作Superpixels:生成随机数量的超像素区域,对原图进行替换,直观效果是原图部分区域变得模糊各种blur:模糊,对应几种滤波操作sharp:字面意思,锐化emboss:压印浮凸字体(或图案); 凹凸印EdgeDetect:原创 2020-07-22 10:52:33 · 1638 阅读 · 0 评论 -
屏蔽FutureWarning
提示错误:AppData\Local\Continuum\anaconda\lib\site-packages\skimage\transform_warps.py:830: FutureWarning:解决方法:在执行的py文件增加如下内容:from warnings import simplefiltersimplefilter(action=‘ignore’, category=FutureWarning)...原创 2020-07-22 10:31:51 · 589 阅读 · 0 评论 -
Python2和Python3的区别
默认编码Python2 的默认编码是 assciiPython 3 默认采用了 UTF-8 作为默认编码缩进Python3 使用更加严格的缩进。Python2 的缩进机制中,1 个 tab 和 8 个 space 是等价的,所以在缩进中可以同时允许 tab 和 space 在代码中共存。这种等价机制会导致部分 IDE 使用存在问题。Python3 中 1 个 tab 只能找另外一个 t...原创 2020-04-04 22:31:04 · 183 阅读 · 0 评论