自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 资源 (4)
  • 收藏
  • 关注

转载 Linux压缩命令tar

其中,-c表示创建新的归档文件,-z表示使用gzip算法进行压缩,-v表示显示详细的压缩过程,-f表示指定归档文件的名称。其中,-x表示解压缩归档文件,-z表示使用gzip算法解压缩,-v表示显示详细的解压缩过程,-f表示指定归档文件的名称。除了上述常见的使用方法,tar命令还支持许多其他选项,以满足不同的需求。其中,-r表示追加文件到归档文件,-v表示显示详细的操作过程,-f表示指定归档文件的名称。其中,-t表示列出归档文件的内容,-v表示显示详细的操作过程,-f表示指定归档文件的名称。

2024-06-07 18:41:04 73

原创 folium.Map 地图无法加载和显示

folium 地图无法加载和显示

2024-01-15 11:45:06 1993 1

原创 Pandas 将DataFrame中单元格内的字典dict拆分成单独的列

【代码】Pandas 将DataFrame中单元格内的字典dict拆分成单独的列。

2023-11-17 11:18:31 281

原创 Pandas 将DataFrame中单元格内的列表拆分成单独的行

explode

2023-11-17 10:57:14 226

原创 pandas print输出格式设置

【代码】pandas print输出格式设置。

2023-11-09 18:09:18 392

原创 linux 查看进程ID 启动命令、占用cpu和内存等信息

这个命令的作用是列出当前系统所有进程的详细信息,并且只显示一行,也就是表头,包括进程的PID、USER、%CPU、%MEM、VSZ、RSS、TTY、STAT、START、TIME和COMMAND等信息。这个命令的作用是列出当前系统所有进程的详细信息,并且按照内存占用量从大到小排序,只显示前10个进程。-k4选项表示以第4列作为排序依据,即按照内存占用量排序,aux选项表示列出所有用户的所有进程,aux选项表示列出所有用户的所有进程,其中,ps命令用于查看进程信息,其中,ps命令用于查看进程信息,

2023-10-09 15:50:16 444

原创 pandarallel 参数说明

Pandarallel共享内存的大小,以MB为单位。:Pandarallel共享内存的大小,以MB为单位。> 1显示所有日志 - 1,仅显示。> 1显示所有日志 - 1,仅显示。默认值太小,可以设置较大的一个。默认值太小,可以设置较大的一个。初始化日志 -

2023-10-08 14:20:27 660

原创 dataframe,根据多列信息生成新列

dataframe,根据多列信息生成新列

2022-09-23 15:02:02 774 1

原创 pandas DataFrame实现组内排名

pandas DataFrame实现组内排名

2022-09-20 17:47:00 771

原创 python 通过 asyncio 异步操作 mongo, 可在 jupyter 上运行

python 通过 asyncio 异步操作 mongo, 可在 jupyter 上运行

2022-05-07 17:56:39 804

原创 python dict key-values互换,values有重复的

key:value ----> value: [k1, k2],def kv_reversal(data_dict): # key-value 互换,value有重复 kv_list = defaultdict(list) for k, v in data_dict.items(): kv_list[v].append(k) kv_list = dict(kv_list) return kv_list

2022-03-07 09:41:18 578

原创 python paramiko操作服务器,文件(夹)上转下载、命令执行

主要实行使用paramiko操作服务器简单操作,例如登录断开,命令执行,以及文件、文件夹的上转或者下载

2022-01-17 16:00:21 1320

原创 python单例模式

class Person(object):# 定义一个类属性,而且将其私有化,表示当前类可以创建的唯一的实例 __instance = None def __new__(cls, *args, **kwargs): print("new~~~~") # 思路:判断__instance的值是否为None,如果为None,则创建当前类的对象并赋值给__instance # 如果__instance不为None,则直接返回结果

2021-07-13 17:12:55 89

原创 自动创建pandas

def make_df(index, cols): df = DataFrame({col: [col + str(i) for i in index] for col in cols}) df.index = index return dfmake_df([1,2,3,4], list('ABCD'))""" A B C D1 A1 B1 C1 D12 A2 B2 C2 D23 A3 B3 C3 D34 A4 B4 C4 D4"""

2021-06-30 11:28:45 109

原创 mysql常见内部函数

1、字符串函数函数 功能char_length(str) 获取字符串的字符个数length(str) 获取字符串的字节数concat(s1, s2,... , sn) 连接s1, s2, ..., sn 为⼀个字符串lower(str) 将字符串str中所有的字符转换为⼩写upper(str) 将字符串str中所有的字符转换为⼤写left(str, x) 返回字符串str最左边的x个字符ri

2021-05-08 15:57:29 153

原创 csv文件是asin编码格式,pandas怎么读取

导包import pandas as pd读取pd.read('./test.csv', , engine='python')重点: engine=‘python’

2021-05-08 14:24:40 1557 1

原创 pandas中对列进行去除前后空格操作(考虑nan的情况)

模块导入import pandas as pdimport numpy as np去除函数def f(s): if isinstance(s, float) and np.isnan(s): return s elif isinstance(s, int) or isinstance(s, float): return str(s).strip() elif isinstance(s, str): return s.strip

2021-04-20 16:25:48 3449

原创 pandas填充nan方式(向下向上,指定值)

fillna方法pd.fillna()pd[col] = pd[col].fillna()参数:method该参数主要控制自动填充,是向上填充还是向下填充method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default Nonepad / ffill: 向下自动填充backfill / bfill: 向上自动填充参数value该参数主要是确定填充数值参数limit向上或者向下填充时控制最大填充前几行...

2021-04-20 14:38:44 3589

原创 pymysql连接MySQL8的,亲测

原始链接代码:import pymysqlcon = pymysql.connect(host='ip:port', user='user', password='psd', database='db', charset='UTF8MB4')sql = "select * from `table` limit 100"try: table = pd.read_sql(sql, con)finally: con.close()报错:

2021-04-19 13:49:02 1294

原创 win下的Django项目总体流程

1、确定python与Django版本2、安装相应的python环境3、安装虚拟环境4、创建相应的Django版本项目5、使用pycharm打开Django项目,指定环境6、创建文件夹:static、templates,并做相应的配置7、配置数据库8、创建路由、视图...

2021-03-28 20:19:40 80

原创 django+vue---3.1创建子应用

1. 在黑窗口中执行命令python manage.py startapp user2. 在配置文件中注册子应用,在 settings.py 中添加3. 在 子应用的文件夹中 创建 子应用的路由文件 urls.py4. 在总路由 urls.py 文件中导入 子应用的路由...

2021-03-14 18:08:26 161

原创 django+vue---1.2 使用pycharm启动项目

在pycharm中指定虚拟环境进去设置中选择项目编辑器选择已经存在的的虚拟环境进入虚拟环境目录下,选择python.exe文件,一路确定即可运行启动文件

2021-03-14 16:16:30 408

原创 django+vue---1.1 win创建虚拟环境、安装并创建django项目

安装python环境参见:python环境安装搭建虚拟环境irtualenv virtualenvwrapper virtualenvwrapper-win在黑窗口中(cmd),安装virtualenv和 virtualenvwrapper:pip3 install virtualenv virtualenvwrapper如果是window:那么要安装 virtualenvwrapper-win,即:pip3 install virtualenv virtualenvwrapper vir

2021-03-13 21:30:49 244

原创 DataFrame中字段的类型判断

说明:如果某一列中有多种类型的数据,那么会被识别为object。单单是str也是object方法:dtype 或者 dtypes直接上代码吧导包import numpy as npimport pandas as pd创建数据data = [[1, '', 0.1, 'lyz']]columns = ['y1', 'y2', 'y3', 'y4']data = pd.DataFrame(data=data, columns=columns)data类型输出data['y1'].

2021-02-22 20:13:21 3663

原创 pandas 读excel,日期变成了数字,pandas方法解决

pandas 读excel,日期变成了数字,pandas方法解决excel中的数据是:pandas读取出来是:import pandas as pddata = pd.read_excel('文件路径')data['发货日期'] = data['发货日期'].fillna(method='ffill') # 因为有合并单元格,data解决方法:def date(para): delta = pd.Timedelta(str(int(para))+'days') tim

2021-02-08 14:09:10 7951 2

原创 pandas自动化实战小任务1--对excel表格分 供应商 付款年月 进行汇总(涉及根据即有相同也有不同的index的表格合并)公司的数据

说明:由于是公司的数据,所以对供应商进行映射处理,数据下载连接(免费):数据下载导包import numpy as npimport pandas as pdfrom datetime import datetimefrom pandas import DataFrame读取数据data = pd.read_csv('./data.csv', index_col=0)月份处理(例如:2020年12月)处理函数# 时间转化# 时间转化def month(v): if

2020-12-29 21:18:54 671

原创 pandas读取文件时xlrd.biffh.XLRDError: Excel xlsx file; not supported, (可版本不回退)

pandas读取文件时出现以下错误xlrd.biffh.XLRDError: Excel xlsx file; not supported原因在于xlrd更新到了2.0.1版本,只支持.xls文件,所以只要将版本回退就好了具体操作pip uninstall xlrdpip install xlrd==1.2.0 -i https://pypi.douban.com/simple安装完毕重新运行就好了...

2020-12-29 11:26:23 562 2

原创 python中datetime、date、string相互转化

包from datetime import datetimefrom datetime import datefrom datetime import timedatetime 转化为 datet = datetime.now()tdatetime.datetime(2020, 12, 16, 21, 41, 37, 786837)t = t.date()tdatetime.date(2020, 12, 16)date 转化为 datetimet = datetime.co

2020-12-16 22:02:39 699

原创 六大排序算法--冒泡-选择-插入-希尔-快速-桶排序--python代码实现

冒泡排序排序思路:比较两个相邻的下标对应的元素,如果符合条件就交换位置(最值出现在最后位)比较的轮数 参与比较的下标 每一轮比较的次数 结果第0轮 0-1 1-2 2-3 3-4 4 得到了最大值第1轮 0-1 1-2 2-3 3 得到了第二大值第2轮 0-1 1-2 2第3轮

2020-12-07 20:17:36 136

原创 python的多个字典dict合并一个字典的九种方法

d1 = {‘name’: ‘revotu’, ‘age’: 99}d2 = {‘age’: 24, ‘sex’: ‘male’}输出:{‘name’: ‘revotu’, ‘age’: 24, ‘sex’: ‘male’}d = {}d.update(d1) # 方法1,使用两次update方法向字典中添加元素d.update(d2)print(d)d = d1.copy() # 方法2,先复制,后更新d.update(d2)print(d)d = dict(d

2020-12-07 20:08:22 38555

原创 python将pdf转化为图片格式,可指定清晰度

import osimport fitzpdf_dir=[]# 当前路径def get_file(): docunames = os.listdir() for docuname in docunames: if os.path.splitext(docuname)[1] == '.pdf':#目录下包含.pdf的文件 pdf_dir.append(docuname) def conver_img(): f

2020-12-07 19:59:22 5570 4

原创 python+selenium+chrome87指定下载路径并解决无头模式下的下载问题

导包from selenium import webdriver使用chrome浏览器options = webdriver.ChromeOptions()options.add_argument('blink-settings=imagesEnabled=false') # 不加载图片, 提升速度options.add_argument('headless') # 无头模式,# 使用指定浏览器打开driver = webdriver.Chrome(options=options)

2020-12-05 11:11:05 2153 6

原创 爬虫证书问题,urllib.request.urlopen(),无法正常响应

urllib.request.urlopen(), 无法正常响应运行以下代码即可在这里插入代码片# 证书问题import sslssl._create_default_https_context = ssl._create_unverified_context

2020-12-01 20:30:47 1295

原创 jupyter lab中pyecharts的.render_notebook()无法显示问题

jupyter lab中pyecharts的.render_notebook()无法显示问题使用pyecharts自带的config来申明一下使用pyecharts的运行环境from pyecharts.globals import CurrentConfig, NotebookTypeCurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LABCurrentConfig.ONLINE_HOST另起单元格import numpy as np

2020-11-26 09:30:32 20923 4

原创 matplotlib和seaborn解决中文字体问题

运行以下代码即可# 解决中文不能显示的问题plt.rcParams['font.sans-serif'] = ['SimHei']# 中文字体无法正常显示负号.plt.rcParams['axes.unicode_minus'] = False# seabornsns.set_style('whitegrid', {'font.sans-serif':['simhei', 'Arial']})...

2020-11-25 14:29:07 904

原创 pandas中字符串object 转化 datetime 类型

import pandas as pdfrom pandas import DataFramefrom dateutil.parser import parse数据data = DataFrame(columns=['date'], data=['2020-11-01','2020-11-05','2020-11-08','2020-11-11'])datadata.info()"""<class 'pandas.core.frame.DataFrame'>Rang

2020-11-19 11:36:27 1673 1

原创 python自定义异常类

#1.自定义异常类,继承自BaseException或者Exceptionclass MyException(BaseException): #2.书写构造函数,定义一个实例属性,表示当异常出现时异常的描述信息 def __init__(self,msg): #3.继承父类的异常机制【调用父类的构造函数】 super(MyException,self).__init__() self.msg = msg #4.重写__str__,返

2020-11-02 17:15:19 275

原创 pandas将某函数应用在所有的values上

applymap函数import numpy as npimport pandas as pdfrom pandas import DataFramecolumns = ['a1','a2','a3','a4']index = ['b1','b2','b3']data = np.random.randint(0,100,size=(3,4))df = DataFrame(columns=columns, index=index, data=data)df# 所有的值 +2df.

2020-10-16 18:27:32 113

原创 pandas设置index索引的标签名

import numpy as npimport pandas as pdfrom pandas import DataFramecolumns = ['a1','a2','a3','a4']index = ['b1','b2','b3']data = np.random.randint(0,100,size=(3,4))df = DataFrame(columns=columns, index=index, data=data)df添加index索引标签名一共有三种方法,nam

2020-10-16 18:15:42 36420

原创 pandas根据某一列删除空行(该列为空或者NaN就认为是空行),也可以指定值来删除

导包import numpy as npimport pandas as pdfrom pandas import DataFrame数据columns = ['a1','a2','a3','a4']index = ['b1','b2','b3']data = np.random.randint(0,100,size=(3,4))df = DataFrame(columns=columns, index=index, data=data)df.loc['b2','a2'] = np.

2020-10-16 17:37:02 3448

实战小任务1文章 所需的数据

excel自动化处理,

2020-12-29

预测年收入是否大于50K美元--adults.txt

读取adult.txt文件,最后一列是年收入,并使用KNN算法训练模型,然后使用模型预测一个人的年收入是否大于50 获取年龄、教育程度、职位、每周工作时间作为机器学习数据 获取薪水作为对应结果

2020-08-01

小麦种类预测数据---seeds.tsv

小麦种类预测,用于算法训练数据,方便自己和网友们使用学习,seeds.tsv文件,最后一列是小麦品种,其他列是小麦特征,根据特征来预测品种

2020-08-01

python语法基础中的--面试题,重点.md

python语法基础面试题和重要知识点,之前在学习python语法结束之后总结出来了,对于一些知识点可能没有详细描述,建议有不懂的,直接看手册或者网上查找资料,培养自我学习能力。希望能对你们有用。

2020-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除