Python基础知识
文章平均质量分 54
*Snowgrass*
主要记录一些技术知识点,并转载一些好技术文章,仅作为学习笔记。若内容有欠缺、不恰当处,欢迎指正。
展开
-
Python 对数函数
python 基础知识转载 2022-07-05 14:38:10 · 8345 阅读 · 0 评论 -
python包的下载网站
python包的下载网站网址1: Unofficial Windows Binaries for Python Extension Packageshttp://www.lfd.uci.edu/~gohlke/pythonlibs/网址2: the Python Package Indexhttps://pypi.python.org/pypi原创 2021-10-12 17:10:31 · 2722 阅读 · 0 评论 -
python 返回指定日期的周一时间和周日时间,返回指定日期区间内的所有周一和周日时间列表
import datetimedef last_first_date_and_last_date(n): """ 获取前n周开始时间和结束时间,参数n:代表前n周 :param n: int类型 数字:1,2,3,4,5 :return: 返回前n周的周一0点时间 和 周日23点59分59秒 """ now = datetime.datetime.now() before_n_week_start = now - datetime.tim...转载 2021-05-28 16:09:24 · 773 阅读 · 0 评论 -
sys.argv
sys.argv[]说白了就是一个从程序外部获取参数的桥梁,这个“外部”很关键,所以那些试图从代码来说明它作用的解释一直没看明白。因为我们从外部取得的参数可以是多个,所以获得的是一个列表(list),也就是说sys.argv其实可以看作是一个列表,所以才能用[]提取其中的元素。其第一个元素是程序本身,随后才依次是外部给予的参数。下面我们通过一个极简单的test.py程序的运行结果来说明它的用法。1 #test.py2 3 import sys4 a=sys.argv[0]5 print(a转载 2020-09-22 16:32:17 · 527 阅读 · 0 评论 -
正则:match\search\findall
re.match:从首位匹配内容,没有匹配到,返回none。re.search:对整个字符串匹配内容,返回匹配到的内容及位置;没有匹配到,将返回 None。re.findall:对整个字符串匹配内容,以列表形式返回所有匹配到的结果。以下为阅读到的一篇讲解比较清晰的博客文章内容。一、模式串匹配正则表达式的主要方法是re.method()这样的模式串匹配,共有四种常用方法:1、matchre.match(pattern, string[, flags])从首字母开始开始匹配,..转载 2020-09-22 10:31:52 · 247 阅读 · 0 评论 -
字符串查找-find/index
python 字符串查找1.find()方法:查找子字符串,若找到返回从0开始的下标值,若找不到返回-1。2. index方法:在字符串里查找子串第一次出现的位置(类似字符串的find方法),若找不到子串,会抛出异常。3.rfind和rindex方法用法和上面一样,只是从字符串的末尾开始查找。s = 'abcdefgabc's.find('a') 0s.index('a') 0s.index('b') 1s.find('b') 1s.rfind('b') 8.原创 2020-09-21 14:14:04 · 1267 阅读 · 0 评论 -
DataFrame中常见函数:
1.统计描述df.describe() #一次性输出多个描述性统计指标df.count()#非空元素计算df.min()#最小值df.max()#最大值df.idxmin() #最小值的位置,类似于R中的which.min函数df.idxmax() #最大值的位置,类似于R中的which.max函数df.quantile(0.1) #10%分位数df.sum()#求和df.mean()#均值df.median() #中位数df.mode() #众数df.var(...原创 2020-09-02 09:56:35 · 753 阅读 · 0 评论 -
数据结构-二叉树
二叉树作为树的一种,是一种重要的数据结构。常见的二叉树有:满二叉树:除叶子结点外,所有结点都有两个结点,叶子结点的left、right为NULL。哈夫曼树:又称为最优二叉数,是一种带权路径最短的树。哈夫曼编码就是哈夫曼树的应用,可以用来进行编码压缩.哈夫曼树的构造见哈夫曼树的构造。完全二叉树:除了最底层的叶子结点之外,,其余层全满,而且叶子层集中在左端.堆是一种特殊的完全二叉树(全满或者差一个结点就全满)。平衡二叉树:所谓平衡二叉树指的是,左右两个子树的高度差的绝对值不超过1。包括AVL原创 2020-08-02 17:41:03 · 136 阅读 · 0 评论 -
时间复杂度O(n)
在计算机科学中,时间复杂性,又称时间复杂度,算法的时间复杂度是一个函数,它定性描述该算法的运行时间。这是一个代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述,不包括这个函数的低阶项和首项系数。使用这种方式时,时间复杂度可被称为是渐近的,亦即考察输入值大小趋近无穷时的情况。时间复杂度的表示方法其实就是算法(代码)的执行效率,算法代码的执行时间。我们来看下面一个简单的代码:int sumFunc(int n) {int num = 0; // 执行一次for (int i =转载 2020-08-02 17:07:35 · 1201 阅读 · 0 评论 -
dataframe列时间字段提取年、月、日、时、分
dataframe的列“时间”包含了年份、月份、import pandas as pddf = pd.read_csv(file, encoding='utf-8-sig')#dateframe 日期数据,字符型转换成日期格式df['日期时间'] = pd.to_datetime(df['日期时间'],format='%Y/%m/%d %H:%M:%S')#获取 日期数据 的年...原创 2020-04-17 11:02:56 · 18240 阅读 · 3 评论 -
pd.read_csv(path file, sep='None')
.csv文件读取总是报各种错。df = pd.read_csv(path file, sep='None') ,好不容易读取出来,又不是我想要的形式。df = pd.read_csv(path1file, sep='None')print(df.shape, df.columns)(101, 1) Index(['col1,col2,col3,col4,col5,col6,col7'],...原创 2020-04-17 10:41:21 · 1545 阅读 · 0 评论 -
pandas.DataFrame.sample
DataFrame进行随机有放回/无放回抽样。DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None)参数: n: 整数,可选 从总样本中随机抽取n个样本。不能与frac一起使用。如果frac= None,则默认= 1...原创 2020-04-08 16:14:58 · 690 阅读 · 0 评论 -
Markdown 首行缩近
1.把输入法由半角改为全角。 两次空格之后就能够有两个汉字的缩进。2.在开头的时候,先输入下面的代码,然后紧跟着输入文本即可。分号也不要掉。 直接写半方大的空白 或 全方大的空白 或 不断行的空白格 或 ...原创 2019-08-10 15:38:22 · 104 阅读 · 0 评论 -
创建html网页
win101、在电脑桌面或者在文件夹中点击:鼠标右键-->新建-->文本文档,一般新建好的文档名字叫“hello.txt”。2、如果您创建的文档没有后缀名“txt”,下面步骤教你如何显示“txt”后缀名。 一种方案:随意打开一个文件夹:点击““选项”-->文件夹选项;初始是“常规”卡,切换到“查看“卡,拖动滚动条,找到”隐藏已知文件类型的扩展名“,去掉单选...原创 2018-08-09 20:32:06 · 3847 阅读 · 0 评论 -
dataframe删除值
dataframe数据import pandas as pdimport numpy as npimport copydata=np.array([[1,6,3],[4,5,2],[9,0,7]])dft=pd.DataFrame(data,index=['line0','line1','line2'],columns= ['a', 'b', 'c'])dftdft ...原创 2019-12-04 12:13:14 · 4857 阅读 · 0 评论 -
dataframe区域/单元格选取数据(iloc/loc/ix)
区域选取 区域选取可以从多个维度(行和列)对数据进行筛选,可以通过df.loc[],df.iloc[],df.ix[]三种方法实现。 采用df.loc[],df.iloc[],df.ix[]这三种方法进行数据选取时,方括号内必须有两个参数,第一个参数是对行的筛选条件,第二个参数是对列的筛选条件,两个参数用逗号隔开。df.loc[],df.iloc[...原创 2019-12-04 11:38:42 · 5402 阅读 · 0 评论 -
筛选df中某列重复值的索引
DataFrame数据import pandas as pddata = {'year': ['2018', '2019', '2016', '2012', '2013', '2016', '2018', '2019'], 'variable': ['A','A','A','B','B','C','C','C'], 'val...原创 2019-11-22 11:56:26 · 2954 阅读 · 0 评论 -
DataFrame列名顺序调整
原DataFrame数据df的列顺序为['aa','bb','cc','dd'],如下所示:import pandas as pdfrom pandas import DataFrameimport numpy as npdf = DataFrame(np.arange(12).reshape((3,4)),index=['a','b','c'],columns=['aa','bb'...原创 2019-10-16 18:10:32 · 3578 阅读 · 0 评论 -
pandas之read_csv 与 to_csv 参数详解
1. read_csvread_csv方法定义:pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None,index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, ...原创 2019-10-18 14:44:44 · 1078 阅读 · 0 评论 -
Dataframe合并
本文讲的是合并两个同列名的Dataframe数据,有两种方案。首先随意的产生两个通列名的Dataframe,如下所示:import pandas as pdfrom pandas import DataFramedf=DataFrame(np.arange(12).reshape((3,4)),index=['a','b','c'],columns=['aa','bb',...原创 2018-09-21 09:11:28 · 4689 阅读 · 0 评论 -
read_sql、read_sql_table和read_sql_query区别
1:read_sql_query()读取自定义数据(通过SQL语句)import pandas as pdpd.read_sql_query(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None,chunksize=None) read_sql_query()中可以接受SQ...原创 2019-08-10 14:08:18 · 5616 阅读 · 1 评论 -
Python 连接 MySQL
1.使用pymysql,连接数据库操作。# encoding:utf-8import pymysql# --------------------------------------------连接数据库----------------------------------db = pymysql.connect(host="xxx", #地址 ...原创 2019-08-10 13:54:54 · 202 阅读 · 0 评论 -
PyCharm 常用快捷键
1.查看使用库源码(Ctrl + B)调用库时,可以在好奇的几乎任何地方点击Ctrl + B,可以很方便的跳转到源码里的类,方法,函数,变量的定义。2. 查找文件、类、方法(Ctrl + Shift + O)在项目中寻找一个文件名的时候,输入Ctrl + Shift + O,然后输入你想查找的文件名就可以了。如果你不记得全名了,只需要输入首字母,Pycharm 就会提示你。3...原创 2020-03-28 11:36:07 · 405 阅读 · 0 评论 -
Python 异常处理
什么是异常?异常即是一个事件,该事件会在程序执行过程中发生,影响了程序的正常执行。一般情况下,在Python无法正常处理程序时就会发生一个异常。异常是Python对象,表示一个错误。当Python脚本发生异常时我们需要捕获处理它,否则程序会终止执行。python标准异常异常名称 描述 BaseException 所有异常的基类 SystemExit ...转载 2020-03-23 20:01:19 · 152 阅读 · 0 评论 -
python 模块源码查看
1.打开cmd命令窗;2.进入python.exe所在安装路径;3.输入python,进入Python环境;4.import model,导入想要查看的模块;5.help(model),查看目标模块的源代码。示例:...原创 2020-03-12 10:08:56 · 1416 阅读 · 0 评论 -
多个.xslx和.txt文件合并
对在同一路径文件夹下的多个.xslx和.txt文件进行合并,合并为一个.xslx和.txt文件。1.多个.xslx文件合并path = "E:\\Data\\"dfs = []for file in os.listdir(path): filepath = path + file print(filepath) df = pd.read_excel...原创 2020-02-20 15:47:00 · 247 阅读 · 0 评论 -
光学字符识别引擎 Tesseract-ocr 安装过程
安装Tesseract-ocr 安装包有两个版本: 稳定版 开发版开始安装:选择安装位置 选择自己希望安装的语言包,反正我是安装语言包不成功。 可以到网站下载自己需要的语言包,直接放到Tesseract-OCR安装目录下的tessdata文件夹下。比如我自己下载了下面两个语言包(简体中文和繁体中文)...原创 2019-12-06 16:47:39 · 493 阅读 · 0 评论 -
jupyter notebook常用快捷键
jupyter notebook 分为编辑模式和命令模式:命令模式:cell左侧为蓝色编辑模式:cell左侧为绿色,输入代码等内容。命令模式 (按键 Esc 开启)注:前提是在命令模式下,即按键Esc进入命令模式。Enter: 转入编辑模式Shift-Enter: 运行本单元,选中下个单元Ctrl-Enter: 运行本单元Alt-Enter: 运行本...原创 2019-12-06 10:33:16 · 168 阅读 · 0 评论 -
jupyter notebook 恢复误删单元格或者历史代码
1、恢复误删单元格的操作 在没有关闭notebook窗口的前提下,先按Esc键进入命令模式,再按z键进行恢复删除的cell。2.恢复之前写过且运行的代码 在一个cell的编辑模式下,写入history就会展示出历史代码(前提是运行过的,否则不会打印出来)。先按Enter进入编辑模式,再输入history即可。...原创 2019-12-06 09:28:15 · 3734 阅读 · 1 评论 -
pycharm快捷键
目录搜索编辑运行调试查找替换重构跳转调试常用搜索Ctrl + Shift + F7用法高亮显示Ctrl + Alt + F7显示用法编辑Ctrl + Shift + V从最近的缓冲区粘贴Ctrl + D复制选定的区域或行到后面或下一行Ctrl + Y删除当前行Ctrl + Shift + J添加智能线...原创 2019-12-05 09:34:42 · 327 阅读 · 0 评论 -
两个set 的交集、并集、差集
set 常见用法语法 操作 说明 set(list1) | set(list2) union 包含 list1 和 list2 所有数据的新集合 set(list1) & set(list2) intersection 包含 list1 和 list2 中共同元素的新集合 set(list1) - set(list2) diffe...原创 2019-12-02 17:26:16 · 3222 阅读 · 0 评论 -
matrix每行/列最大值及其索引
矩阵每行/每列最大值行:np.amax(aa, axis=1)列:np.amax(aa, axis=0)矩阵每行/列最大值的索引行:np.argmax(aa, axis=1)列:np.argmax(aa, axis=0)示例:1.矩阵每行最大值及其索引。aa = [[0.25, 0.97, 0.17, 0.04, 0.49], [0.97,...原创 2019-11-28 18:07:46 · 2655 阅读 · 0 评论 -
随机数(random/numpy)
目录random库 1.参生n--m范围内的一个随机数:random.randint(n,m)2.产生0到1之间的浮点数:random.random()3.产生n---m之间的浮点数:random.uniform(1.1,5.4)4.产生从n---m间隔为k的整数: random.randrange(n...原创 2019-11-28 17:11:56 · 759 阅读 · 0 评论 -
pip 查看安装包有那些版本
安装某些package时,在满足大于某个版本,小于弄版本时,又不知道对应的包具体有哪些版本,可以用 pip install package_name== 进行查看包有哪些版本。示例:pip install python-dateutil==ERROR: Could not find a version that satisfies the requirement pyt...原创 2019-11-28 16:16:18 · 8786 阅读 · 0 评论 -
conda回滚更新包
利用 conda update -all 更新了所有的conda包,现在想回滚conda更新的包。conda update -all回退版本的方法conda list --revisionrev N 是历史版本,然后再运行conda install --rev 1就可以回到第1个版本。...原创 2019-11-26 09:49:51 · 1355 阅读 · 0 评论 -
Python 格式符
格式符格式符为真实值预留位置,并控制显示的格式。格式符可以包含有一个类型码,用以控制显示的类型,如下:%s 字符串 (采用str()的显示)%r 字符串 (采用repr()的显示)%c 单个字符%b 二进制整数%d 十进制整数%i 十进制整数%o 八进制整数%x 十六进制整数%e 指数 (基底写为e)...原创 2019-11-25 16:14:53 · 235 阅读 · 0 评论 -
tuple 函数
tuple作用与list: 函数将列表转换为元组。list_a = [1,5,6]tuple(list_a)Out[1]: (1, 5, 6)tuple作用于dict: 函数将字典键值转换为元组dict_a = dict(zip(['s','t','y'],[5,9,7]))tuple(dict_a)Out[2]: ('s', 't', 'y')...原创 2019-11-22 10:48:03 · 1648 阅读 · 0 评论 -
dict/list/set合并
总结归纳Python合并dict/list/set。合并两个set方法:set_a|aet_bset_aOut[1]: {1, 5, 6, 9}set_bOut[2]: {1, 4, 6, 7, 8, 9}set_a|set_bOut[3]: {1, 4, 5, 6, 7, 8, 9}合并两个dict方法:dict(dict_a,**dict_b) ...原创 2019-11-19 18:08:03 · 1377 阅读 · 0 评论 -
字符dict还原为dict
利用eval函数,进行操作实现。eval(str(dict)) => dict示例:dictC = { 'confidence': 0.79772234, 'content': '上菜太慢!!!真的超级慢性价比很不错的一家潍坊菜馆,味道不错的。', 'label': 1}strC = str(dictC)strCOut: "{'confidence...原创 2019-10-16 18:38:29 · 245 阅读 · 0 评论 -
openpyxl、xlrd、pandas读取Excel文件sheet
利用openpyxl、xlrd、pandas获取Excel表的sheet。import openpyxlwb = openpyxl.load_workbook('ceshi.xlsx')Sheets = wb.sheetnamesimport xlrd wb = xlrd.open_workbook('ceshi.xlsx')wb.sheet_names()import...原创 2019-08-19 13:53:13 · 3768 阅读 · 2 评论