Python
Renlijuande
这个作者很懒,什么都没留下…
展开
-
ModuleNotFoundError: No module named ‘scipy.sparse.linalg.eigen.arpack‘; ‘scipy.sparse.linalg.eigen‘
是因为新的scipy包更新了,不能采用。原创 2023-07-26 02:33:23 · 1841 阅读 · 0 评论 -
安装不了opencv
安装opencv失败原创 2023-02-04 04:24:47 · 1715 阅读 · 0 评论 -
python中的随机数
老是忘记各种生成随机数,mark一下1.随机生成一个指定范围内的整数LOW = 0HIGH = 10loc_instance = np.random.randint(LOW, high=HIGH, size=None)即生成一个范围是[0,9]的整数,注意这个地方取不到102.从list中选择指定数量的值columns_list=[1,2,3,4,5]NUM = 2choice_columns = random.sample(columns_list, NUM)即从列表columns原创 2021-09-30 07:01:51 · 213 阅读 · 0 评论 -
python的一些mark
python的mark1.pandas批量修改某些行的一些列test = [[1,2,3],[1,2,1],[11,2,3]]df = pd.DataFrame(test)print(df)df.iloc[[1,2], 2] = np.nanprint(df)结果:注意:df.iloc[[1,2], 2] = np.nan中[1,2]是列表2.pandas写入数据库不支持NaN(生气!!!找了半天问题)如果你是生成缺失值的数据集的话,绕开df_temp.to_csv(path, h原创 2021-08-25 04:55:25 · 555 阅读 · 0 评论 -
python 实现的简单的轮盘赌
前言之前写过很多次,后面再用老是要重新写,mark一下轮盘赌算法原理轮盘赌选择法(roulette wheel selection)是最简单也是最常用的选择方法,在该方法中,各个个体的选择概率和其适应度值成比例,适应度越大,选中概率也越大。但实际在进行轮盘赌选择时个体的选择往往不是依据个体的选择概率,而是根据**“累积概率”**来进行选择。轮盘赌选择法的过程如下:(1)计算每个个体的被选中概率p(xi)(2)计算每个部分的累积概率q(xi)(3)随机生成一个数组m,数组中的元素取值范围在0和1原创 2021-04-21 01:06:06 · 6610 阅读 · 3 评论 -
python Dataframe iloc时一直报out-of-bounds 和 根据行索引取Dataframe的多行值
今天在用pandas时候遇到了Dataframe的iloc一直报out-of-bounds这个错,这个简单理解就是越界了。1.普通情况举个简单的例子:import pandas as pddataset=[[1,2.222,3,4,5],[2,None,None,None,5],[None,None,3,4,None],[1,2.5661,3,4,5.234]]df=pd.DataFrame(dataset)# 删除df中的一行print("--------原始的df--------")原创 2020-12-12 14:41:50 · 13557 阅读 · 1 评论 -
python pycharm 安装sklearn的 坑
之前用anaconda安装过一次python的sklearn模块,就各种问题,今天用pycharm安装也是各种报错,例如这样的:No module named ‘numpy.distutils._msvccompiler’ in numpy.distutils; trying from distutils刚开始查了一下,各种让安装C++的文件,后来就发现了一个良心的网址:https://www.cnblogs.com/TTyb/p/6437459.html突然让半路如python坑的我,茅塞顿开。归根原创 2020-12-11 12:14:29 · 31106 阅读 · 2 评论 -
python 采用pandas的DataFrame实现对数字类型用均值填补和分类类型用众数填补
今天在用python对数据的数字类型用均值填补,分类类型用众数填补,遇到几个坑,mark一下:1.众数需要一列一列的填补2.DataFrame的mode()函数会返回一个series,即多个数需要从中选择一个进行填补,不然会一直填补不上。(我这里是随机选择一个)源码如下"""采用均值和众数将缺失值填补dataset是listcolumns_classification是list,分类类型的位置"""def impute_data_by_mean_or_mode(dataset,column原创 2020-12-10 18:41:57 · 2408 阅读 · 1 评论 -
python DictVectorizer 两个坑(无用字段和数字类型)
功能描述:载入一些数据,然后将其中的字符串转换为数字。注意:我这里使用,是一种one-hot的思想,或者可以理解为词袋或二进制。例如:笔有三类:钢笔、铅笔、毛笔。那么就可以用三位是二进制数来表示,那么钢笔100,铅笔010,毛笔001. 这里有个很明显的缺点,当你的类型很多时,数据就会很稀疏。先看源码:(数据和转换请看我上一篇博文)#判断是否为数字def is_number(s): try: float(s) return True except Va原创 2020-12-09 18:01:54 · 330 阅读 · 0 评论 -
Python list转DataFrame 出现None列
今天用python将list转为DataFrame时,出现了诡异的一幕,多了一列空列,源代码如下,(数据是UCI的开源数据,下载链接)def load_data(filepath): data= [] with open(filepath) as ifile: for line in ifile: rowList = [] tokens = line.strip().split(' ')#分割为两个空格(这行代码就是原创 2020-12-09 16:53:18 · 1608 阅读 · 1 评论 -
python 将数据集划分为完整数据集和缺失数据集
首先需要用的python包:import pandas as pd然后,正式开始处理数据。1.定义一个数组dataset=[[1,2,3,4,5],[1,2,3,None,5],[1,None,3,4,5],[1,2,3,4,5]]2.将list类型转为pandas的DataFrame类型df=pd.DataFrame(dataset)print(df)3.找到具有缺失值的数据dataset_missing=df[df.isnull().values==True]print(da原创 2020-12-07 16:35:43 · 872 阅读 · 0 评论 -
Python numpy给自己的mark文件
1.numpy判断nannp.isnan()#返回的是布尔类型2.numpy的两个array拼接(引用自链接)‘+’/‘*’号:两个array对应值相加/相乘>>> aarray([0, 1, 2], [3, 4, 5], [6, 7, 8])>>> b = a*2>>> barray([ 0, 2, 4], [ 6, 8, 10], [12, 14, 16])1、水平组合&原创 2020-11-27 10:40:56 · 153 阅读 · 0 评论 -
Python pandas给自己的mark文件
1.pandas: 获取Dataframe的行数和列数返回列数:df.shape[1]返回行数:df.shape[0] 或者:len(df)2.读txt文件data = pd.read_table(file_path,header=None,delim_whitespace=True,encoding='gb2312')说明:#header=None:没有每列的column name,可以自己设定#encoding=‘gb2312’:其他编码中文显示错误#delim_white原创 2020-11-25 22:46:45 · 229 阅读 · 2 评论 -
python读CSV文件
一、《中国卫生健康统计年鉴》是一部反映中国卫生健康事业发展情况和居民健康状况的资料性年刊。本书收录了全国及31个省、自治区、直辖市卫生健康事业发展情况和目前居民健康水平的统计数据以及历史重要年份的全国统计数据。本书为《中国卫生健康统计年鉴》2019卷,收编的内容截至2018年年底。https://www.yearbookchina.com/downsoft-n3019102807.html...原创 2020-11-11 17:26:22 · 160 阅读 · 0 评论 -
写入csv文件,与一个字符一个格子的问题
本文只是为了帮自己mark一下使用包import csv代码def write_excel(path, datas): csvFile2 = open(path,'w',newline='') writer = csv.writer(csvFile2) m = len(datas) for i in range(m): writer.writerow(datas[i]) csvFile2.close()注意:如果写出的csv文件中变成一个原创 2020-08-31 18:32:06 · 4158 阅读 · 0 评论 -
python根据文件名列表读excel数据
python根据文件名列表读excel数据,并写入csv文件给定一个包括多个文件名的列表(文件列相同),读取数据并拼接在一起。读excel使用的包有import csvimport pandas as pd读excel文件中全部数据def readXlsx_all(path): datas=[] empty_data=[] try: sheet = pd.read_excel(path) df = p原创 2020-08-31 18:24:01 · 754 阅读 · 0 评论