Python学习
Poisson_SHAN
这个作者很懒,什么都没留下…
展开
-
VSCode python extension loading
最近vscode更新后,运行py程序一直不行。发现底部有一个python extension loading一直在加载在网上搜索了很多,发现有一个方法,把python扩展包的版本降回之前的。我这里降回了20年11月时候的版本发现好了...原创 2021-04-20 12:02:06 · 4017 阅读 · 2 评论 -
onehot逆编码,把onehot编码的矩阵变为一维向量
onehot逆编码,把onehot编码的矩阵变为一维向量如下原创 2021-01-07 18:04:33 · 1849 阅读 · 0 评论 -
Pycharm及anaconda环境配置的一些体会(mac)
Pycharm及anaconda环境配置的一些体会在一开始的New Project中new environment using conda与在anaconda navigator的environment中创建一个新的环境是一样的。它被保存在anaconda下的envs中,这个是重复占用空间的。看了看,还蛮大的,稍微几个包,几百Mb。虚拟的vitualenv是虚拟的环境,加载包不知道是不是重复占...原创 2020-04-22 23:21:04 · 251 阅读 · 0 评论 -
解决方案SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position xx: truncated
今天在学《用python玩转数据》C6做数据分析项目例题时,发现一个error:SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 70-71: truncated \uXXXX escape看了别人的blog才知道是文件路径输入出了问题:我的错误输入版本:users = pd...原创 2018-12-19 17:50:50 · 6092 阅读 · 0 评论 -
#元组
1、‘*’号有收集参数的作用python中多个参数可以构成一个元组作为函数的参数,而元组的个数是不定长的,所以这就是可变长的函数参数。原创 2018-12-06 17:15:04 · 228 阅读 · 0 评论 -
#列表
sort函数和sorted方法不同的list.sort()直接改变list而sorted(list)则不会列表解析原创 2018-12-05 21:35:54 · 182 阅读 · 0 评论 -
简易网络爬虫eg
"""'''运用request库进行网页的抓取运用BeautifulSoup库和正则表达式模块进行网页内容的解析'''import requestsfrom bs4 import BeautifulSoupimport re #导入正则表达式s = 0r = requests.get('https://book.douban.com/subject/1084336/')sou...原创 2018-12-05 17:22:47 · 220 阅读 · 0 评论 -
算法图解 Grokking Algorithms —— 笔记
线性时间(linear time):简单查找对数时间(log time):二分查找1.3大O表示法——算法时间的表述:知道运行时间如何随列表增长而增加大O表示法能够比较操作数,指出了算法运行时间的增速O(n2)选择排序O(n!)旅行商问题O(nlogn)快速排序三、四 递归用递归方法求和数组中元素的和def sum(list): if list==[]: ...原创 2018-11-14 17:34:05 · 916 阅读 · 0 评论 -
包package和库library
原创 2018-10-10 21:41:52 · 491 阅读 · 0 评论 -
python变量管理
每个对象被创建时都会获得一个身份 id,可用 id()函数查看,同时会伴随一个引用计数器。例如:PI = 3.14159pi = 3.14159PI is piFalse分析:因为 PI 和 pi 指向了两个不同的 3.14159,它们有各自的内存空间,可通过 id()函数查看id(PI)2376033150440id(pi)2376033150416pi = PIPI ...原创 2018-10-10 17:01:46 · 700 阅读 · 0 评论 -
读写文件
shell(idle)中,要打双斜杠\才能正确识别f.write(‘path’)方法是对file文件内容全部清除后,重新覆盖。如果要想对文件中的某一部分后操作。需要使用seek()方法这是因为有文件指针的存在。在读写文件时,文件指针跟着行移动,有时当前指针的位置就不再是开头,或是我们想要的位置了。具体操作如下:...原创 2018-10-16 17:47:14 · 174 阅读 · 0 评论 -
EXCEL文件(xlsx)的读取与data的写入
使用ExcelFile时,通过将xls或xlsx的路径传入,生成一个实例:xlsx = pd.ExcelFile('example/ex1.xlsx')存储在表中的数据可以通过pandas.read_excel读取到DataFrame中:如果你读取的是含有多个表的文件,生成ExcelFile更快,但你也可以更简洁地将文件传入pandas.read_excel:如需将pandas数据写...原创 2018-10-07 17:18:06 · 5080 阅读 · 0 评论 -
字典
字典的几种表示原创 2018-12-09 17:29:14 · 189 阅读 · 0 评论 -
【python】如何在某.py文件中调用其他.py内的函数
假设名为A.py的文件需要调用B.py文件内的C(x,y)函数假如在同一目录下,则只需import Bif __name__ == "__main__": B.C(x,y)若只需调用单个函数,也可以from B import Cif __name__ == "__main__": C(x,y)若A.py和B.py位于不同的目录下,可以用以下方法(假设B.py位于...原创 2018-12-09 17:31:44 · 439 阅读 · 0 评论 -
pd.Dataframe修改值及在原df基础上增加一个属性(column)
考虑给原有df增加一个属性,可以先增加一个空白列,如图:再更新空白列中的值然而,不能使用下面这种线性调用而应该尽量使用下面这两种原创 2019-05-02 23:59:29 · 4442 阅读 · 0 评论 -
pip show显示包的安装路径
"Pip installs from PyPI. There are no releases of the basemap package on PyPI, it is just a simple registration page pointing at the real download location (SourceForge).Conda pulls from its own repo...转载 2019-03-28 12:26:17 · 2553 阅读 · 0 评论 -
jupyter-lab使用技巧
jupyter-lab 是对jupyter notebook的升级,能实时地查看代码结果,对于数据处理、可视化来说也很方便之前一直是在Anaconda Prompt中打开jupyter-lab的,所以用的默认目录C:\User\Administrator近期,发现一个在指定文件夹目录中打开jupyter-lab的好方法键盘Shift+鼠标右键->在此处打开命令窗口-> 在弹出的命...原创 2019-03-26 11:17:45 · 6501 阅读 · 0 评论 -
numpy.meshgrid()理解
https://blog.csdn.net/lllxxq141592654/article/details/81532855转载 2019-01-31 15:58:59 · 320 阅读 · 0 评论 -
python中的os.path.dirname(__file__)的使用
os.path.dirname(file)返回脚本的路径,但是需要注意一下几点:1、必须是实际存在的.py文件,如果在命令行执行,则会引发异常NameError: name ‘file’ is not defined2、在运行的时候如果输入完整的执行的路径,则返回.py文件的全路径如:Python c:/test/test.py 则返回路径 c:/test ,如果是python test.p...转载 2018-12-27 17:04:59 · 427 阅读 · 0 评论 -
解决错误:'utf-8' codec can't decode byte 0xb0 in position 0: invalid start byte
今天做项目新闻标题热点数据挖掘,形成词云图片。写完读取stopwords.txt文件时stop_words = set(line.strip() for line in open(r'E:\CS\Python\python玩转数据\chineseStopWords.txt', encoding = 'utf-8'))运行时遇上了一个错误,如下:'utf-8' codec can't de...原创 2018-12-27 17:02:21 · 22354 阅读 · 0 评论 -
GUI-wxPython错误PyNoAppError: The wx.App object must be created first!
之前每次运行程序时,第一次都可以正常生成GUI,但是第二次程序就会报错:PyNoAppError: The wx.App object must be created first!后来研究发现,在程序的末尾加上del app可以有效解决此问题E.g.:#派生Frame的子类,修改了原来Frame子类的__init__()方法import wxclass Frame1(wx.Frame):...原创 2018-12-21 21:36:01 · 3167 阅读 · 9 评论 -
#Series and DataFrame
Series对应的是一维序列,DataFrame对应的是二维表结构,是一种表格型的数据结构,可以看作是共享同一个index的Series的集合1.怎样创建一个DataFrameDataFrame对象可以由列表、元组、字典创建,也可以由ndarray或者Series或者文件来创建。DataFrame DataFrame是一个表格型的数据结构,它含有一组***有序***的列,每列可以是不...原创 2018-12-10 17:53:16 · 371 阅读 · 0 评论 -
ndarray
原创 2018-12-09 21:09:31 · 721 阅读 · 0 评论 -
to_pickle,to_csv等写入操作
本人windows系统中,使用read_csv,read_html,read_table等操作,路径中都可以以’\'符号隔开。如:frame = read_csv(E:\CS\Python\PythonforDataAnalysis\pydata-book-2nd-edition (1)\pydata-book-2nd-edition\examples\ex1.csv)但是在to_csv,...原创 2018-10-07 16:44:30 · 2607 阅读 · 1 评论 -
!!return——执行了return语句,后面的语句将不会执行!!
如果执行了return语句,那么后面的语句将会不执行。当前函数只要执行了return,之后的代码是不可能执行的如果没到return,比如return 在 if里面,而if没满足条件,那有可能执行后面的语句def f(x): if x>5: return False return True...原创 2018-10-13 19:14:45 · 14734 阅读 · 2 评论 -
#循环loop
range()函数 python range() 函数可创建一个整数列表,一般用在 for 循环中。 函数语法range(start, stop[, step])start: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0, 5);stop: 计数到 stop 结束,但不包括 stop。例如:range(0, 5) 是[0, 1, 2, ...转载 2018-08-06 22:26:58 · 208 阅读 · 0 评论 -
#Python3 面向对象——转自菜鸟教程
python3 面向对象|菜鸟教程 面向对象技术简介 类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。 方法:类中定义的函数。 类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。 数据成员:类变量或者实例变量用于处理类及其实例对象的相关的数据。 方法重写:如...转载 2018-08-10 23:54:15 · 344 阅读 · 0 评论 -
#文件处理的点滴
input() Python3.x 中 input() 函数接受一个标准输入数据,返回为 string 类型。 因此如果用input()函数返回一个数值后,其实为string类型,我们需要将它用int()函数强制转换。num = int(input("How many sheep do you have? \n")) #input()函数输入的是一个string字符串类型的数cou...原创 2018-08-01 23:16:16 · 166 阅读 · 0 评论 -
#python中的random模块
这篇文章我们介绍Python3中一个比较简单的模块,random模块,顾名思义:是生成随机数的一个模块;言归正传,下面将对random中的常见函数进行讲解:(1)、random():无参数,随机生成浮点数,区间为(0,1]示例:print(random.random())输出:0.8959623450106021(2)、randint(start,stop):两个参数,随机生成...转载 2018-08-10 16:05:14 · 529 阅读 · 0 评论 -
list和dict的表示
list列表用[ ]表示:>>> things = ['a','b','c','d']>>> print(things[1])b>>> things[1] = 'z'>>> things['a','z','c','d']字典dict用{ }表示:>>> stuff = {原创 2018-08-10 12:40:18 · 312 阅读 · 0 评论 -
#有序的字典collections.OrderedDict
python模块介绍- collections(5)-OrderedDict 有序字典 1.3.5 OrderedDict 有序字典OrderedDict是dict的子类,它记住了内容添加的顺序。import collectionsprint ‘Regular dictionary:’d = {}d[‘a’] = ‘A’d[‘b’] = ‘B’d[‘c’] = ‘C’...转载 2018-08-09 21:08:31 · 1918 阅读 · 0 评论 -
#python 字典的get()方法
字典和list的区别: list可以表示一串有贵族的项,而字典用来match一些items(键keys)和另一些items(值values)Python 字典(Dictionary) get() 函数返回指定键的值,如果值不在字典中返回默认值。 get()方法语法:dict.get(key, default=None) 参数 key – 字典中要查找的键。 default –...原创 2018-08-09 21:05:33 · 4616 阅读 · 0 评论 -
#读写文件 EX15-17
文件读取我们要做的是把文件用我们的脚本打开(open),然后打印出来。然后如果直接把.txt文件写死(hard coding)是不好的,这些信息应该由用户输入。因此,解决方案是使用argv和input()来从用户处获取信息。open函数 python open() 函数用于打开一个文件,创建一个 file 对象,相关的方法才可以调用它进行读写。 函数语法:open(name...原创 2018-07-31 23:32:33 · 993 阅读 · 0 评论 -
#String和文件处理——EX11-14
String的使用script, user_name = argv #argv: Argument variable参数变量print(f"Hi {user_name}, I'm the {script} script.")如上,f-string是3.6推出的,很遗憾,我的3.5版本不能使用,但是可以用str.format()print("Hi {}, I'm the {} sc...原创 2018-07-31 12:46:56 · 272 阅读 · 0 评论 -
#环境初设
安装好python3后,需用cmd或Powershell调试是否已经将python3配置到计算机中。 可以看到我这里因为使用了Spyder,Anaconda中直接安装好了3.5.2版本的python。如下处理好后,若需要在Powershell中运行编辑好保存了的python文件(.py),特别需要注意在Powershell中更改路径,不然Powershell是找不到你要运行的文件的。输入...原创 2018-07-31 12:05:12 · 161 阅读 · 0 评论 -
#字符内部处理
许多通用日常的字符仍用8位,其余用比8位大的 UTF-8:Unicode Transformation Format 8 bits> :prompt codec encoding: 编码(把字符转换成相应的UTF-8、ASCII码输出) decode:解码(把8位ASCII码转换成对应的字符输出)ASCII:American Standard for Internationa...原创 2018-08-07 15:17:48 · 158 阅读 · 0 评论 -
#textwrap模块的dedent
dedent用来去除用“”“表示输出段落时段落前缩进的空白,使得靠左输出。 例子:from sys import exitfrom random import randintfrom textwrap import dedentprint(dedent(""" erefdfdf ererereeeeeeeeeeeeew dddddd...原创 2018-08-11 23:01:32 · 2197 阅读 · 0 评论 -
从网页获取数据
有的网站会提供一个爬虫协议文件robots.txt例如豆瓣的爬虫协议:https://www.douban.com/robots.txt这里我们要对《小王子》的豆瓣评论进行抓取,需要用到的是subject这个目录,在豆瓣网页的爬虫协议中,并没有禁止这项操作。200表示一切正常抓取源代码:注:1、响应内容是二进制,要用r.content 来解码(比如抓取图片时,生成的数据是二进制...原创 2018-10-17 21:02:12 · 2557 阅读 · 0 评论 -
AttributeError: 'module' object has no attribute '_base'
较为完整的错误信息是:class TreeBuilderForHtml5lib(html5lib.treebuilders._base.TreeBuilder): AttributeError: ‘module’ object has no attribute ‘_base’大概就是说html5lib里面的treebuilders里面没有_base这个属性(其实就是找不到 _ba...转载 2018-10-06 20:44:58 · 1088 阅读 · 0 评论 -
循环和递归
递归递归必须要有边界条件,即停止递归的条件:例子:斐波那契数列 后一项为前两项的和0,1,1,2,3,5,8…def fib(n): a, b = 0, 1 count = 1 while count < n: a, b = b, a+b count = count + 1 print(a)使用递归:def fib(n): if n==0 or n==1: ...原创 2018-10-12 18:18:10 · 261 阅读 · 0 评论