Python
python心得与总结
全 洛
Program = data structure + algorithm
展开
-
ModuleNotFoundError: No module named ‘sklearn.cross_validation‘解决办法
在Python机器学习中,会用到使用 scikit-learn 中的train_test_split函数,把数据集切分为训练集和测试集。from sklearn.cross_validation import train_test_split 用后发现会报错ModuleNotFoundError问题原因:这个cross_validatio这个包早就不在使用了,划分到了model_selection这个包中。解决办法:使用下方导入模块代码from sklearn.model_selectio原创 2021-09-07 12:13:53 · 785 阅读 · 0 评论 -
mac下启动jupyter notebook
首先打开终端然后输入start jupyter notebook命令python -m IPython notebook### 如果是python3的环境就用下面的命令python3 -m IPython notebook最后浏览器就会自动打开 jupyter notebook原创 2021-03-03 11:08:38 · 7029 阅读 · 4 评论 -
Python 一键创建依赖包和一键安装依赖包
使用 pip创建依赖包requirements.txt 用来记录项目所有的依赖包和版本号,只需要一个简单的 pip 命令就能完成。记住在你代码文件夹下创建你这些代码所需要的依赖包pip freeze > requirements.txt会生成的一个requirements.txt 文件内容会像这个样子alabaster==0.7.12anaconda-client==1.7.2anaconda-navigator==1.9.12anaconda-project==0.8.3appl原创 2021-01-24 00:22:29 · 1012 阅读 · 0 评论 -
python中68个内置函数的总结
内置函数就是python给你提供的, 拿来直接用的函数, 比如print., input等. 截止到python版本3.6.2 python一共提供了68个内置函数原创 2020-06-12 19:12:02 · 1778 阅读 · 0 评论 -
解决关于使用Selenium WebDriver 在Python打开浏览器时出错
错误1:Traceback (most recent call last):File "E:/codes/python/script.py", line 5, in <module>driver.get("http://www.python.org")TypeError: get() missing 1 required positional argument: 'url'错误2:SessionNotCreatedException: Message: session not cr原创 2020-05-27 20:09:21 · 6615 阅读 · 0 评论 -
我通过Python对自己的微信朋友圈进行了可视化分析得到了意想不到的答案
目录前提准备第一步获取朋友圈好友的数据第二步处理数据,并存储到txt文件中第三步开始分析,走起!3.1 分析朋友圈sex3.2 分析好友昵称,看看起名都有什么个操作3.3分析哪里来的3.4分析朋友圈的个性签名最后了,重磅来袭,输出说有朋友圈的头像合成在一张图片上前提准备确保安装用到的模块和库:itchatpyechartsjiebawordcloud collections第一步获取朋友圈好友的数据import itchat# 获取数据def get_data(): itc.原创 2020-05-25 22:56:21 · 1916 阅读 · 5 评论 -
IndexError: list index out of range的错误分析
造成错误有以下两种情况:第1种list[index] index超出范围index索引是从0开始的,因此如果list列表里有10个元素,那它最后一个元素的索引是9,而不是10。第2种list是一个空列表,没有一个元素。所以进行list[index]就会出现该错误。...原创 2020-05-25 20:58:47 · 1548 阅读 · 0 评论 -
初学python网络编程socket,并实现文件传输【含源代码】
Socket什么是Socketsocket()函数socket 对象内建方法实例:实现文件传输实例演示:源代码:最后什么是Socketsocket又称“套接字”, 应用程序通常通过“套接字”向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通讯。socket()函数Python 中,我们用 socket()函数来创建套接字,语法格式如下:socket.socket(family, type, protocol)参数: family: 套接字家族可以使AF_UNIX或者AF_原创 2020-05-18 20:06:49 · 4034 阅读 · 0 评论 -
python可视化入门 plotly ,小白请进
大佬看到这里就可以走了, 小白可以继续看了,本篇文章只是【plotly】入门级注意:本篇文章使用的是离线版本的plotly,没有用线上版的,直接在pycharm上运行的。入门篇 plotly安装 `plotly`导入`plotly`模块example1 `Scatter`example2 `Bar`example3 `Histogram`example4 `Express`example5 `pie`example6 `3D`example7 `Densitymapbox``plotly`官方文档:原创 2020-05-16 20:00:34 · 12411 阅读 · 4 评论 -
对一个DataFrame的一个列进行映射,得出一个新列。
通过字典映射,将DataFrame某个文字列映射出一个数字列,使得在程序里使用更加方便。import pandas as pddata = pd.DataFrame({'name': ['h1', 'h1', 'h2', 'h2' ,'h3' ,'h4','h3' ,'h4']})''' name0 h11 h12 h23 h24 h35 h46 h37 h4'''name_to_color = { 'h1': 0, 'h2': 1, 'h3': 2, 'h4原创 2020-05-13 19:59:12 · 5888 阅读 · 2 评论 -
论Python导入模块的三种修养【干货】
最进有些萌新老是混洗python导入模块的三种方法,甚至不知道各个都有什么作用,这回我来彻底讲解下,让你们不再迷茫。原创 2020-05-11 11:12:31 · 332 阅读 · 0 评论 -
scrapy实战----将数据存储到csv文件和MySQL数据库中
本章将通过爬取51jobs求职网站中的python职位信息来实现不同方式的数据存储的需求。github地址———>源代码我们先来看一下:51jobs网站我们需要的数据有,职位名 公司名 工作地点 薪资,这四个数据。然后我们看一下他们都在哪发现他们都在这里面需要的数据,相应的都在这里面好了到这,我们已经知道了抓取的数据都在哪了。接下来我们开始写代码。创建项目使用命令scrapy startproject tongscrapy 来创建一个scrapy框架。然后使用scra原创 2020-05-10 10:50:22 · 5355 阅读 · 0 评论 -
Python中的 !r 和 !s 的字符串格式区别
!s(apply str())和!r(apply repr())可用于在格式化之前转换值。字符串之间的区别很容易看出来(因为repr字符串将包含外部引号):>>> 'foo {!s}'.format('bar')'foo bar'>>> 'foo {!r}'.format('bar')"foo 'bar'"这两种方法之间的区别实际上主要取决于要格式...原创 2020-05-08 17:30:20 · 3102 阅读 · 0 评论 -
Pandas中DataFrame ffill向下填充,学习笔记
注意:这篇文章纯粹是为了我自己看的,用来记笔记的。不用看考虑一个DataFrame df:col_name0 Category11 item1()2 item2()3 Category24 item3()5 item4()6 item5()需要转变为这样: col_name category1 item1() ...原创 2020-05-07 16:11:46 · 5319 阅读 · 0 评论 -
with语句还能这么用,你会吗?——with语句和上下文管理器
有人认为Python的with语句是一个晦涩的特性,但只要你了解了其背后的原理,就不会感到神秘了。with语句实际上是非常有用的特性,有助于编写更清晰易懂的python代码。原创 2020-05-07 12:57:38 · 505 阅读 · 0 评论 -
python,通过一行代码输出python和库的版本信息
编程前,运行代码前,得先确定自己的编译环境是否良好。该文章将帮助您测试环境。它能帮助你将每个需要使用的库打印出版本信息。而且,如果你还不知道自己的python是什么版本的也能通过它来得知。原创 2020-05-05 19:04:37 · 6367 阅读 · 0 评论 -
两行代码打印出ASCII码字母表、数字、标点符号(python)
学而时习之,不亦说乎。每天学点编程小技巧。原创 2020-05-05 18:48:24 · 1425 阅读 · 0 评论 -
一行代码让python的运行速度提高100倍
说道现在最流行的语言,就不得不提python。可是python虽然容易上手,但速度却有点感人。如何用简单的方法让python加速到近乎可以媲美C的速度呢?今天来就来谈谈numba这个宝贝。对你没看错,不是numpy,就是numba。原创 2020-04-30 19:34:04 · 1465 阅读 · 0 评论 -
用python爬取qq好友的头像并都下载到本地
正常步骤先上爬取效果图:原理:从邮箱开始半自动爬取qq好友头像。首先我们先打开网页版qq邮箱,并登陆上你的qq账户,通过qq邮箱来获取所有人的qq号。接下来我用Google Chrome 浏览器来演示:在qq邮箱网页界面 摁 F12 键 ,然后在弹出的界面 点击 Network 选项。然后刷新一下网页,并在在红色箭头的地方输入laddr_lastlist,然后回车然后单击下面...原创 2020-04-23 12:38:32 · 1457 阅读 · 0 评论 -
学Python这么久了还不知道__init__(),__new__(),__del__()吗?这回彻底掌握它!
学python的,学过类与对象的,都会经常看到和用到**__init__(self, ),__new__(cls, ),__del__(self)。**但是很多可能见过的,却不知道怎么用,或者为什么用。没有真正的了解它们。然而其实这些就是我们学习面向对象编程语言中的构造方法和析构方法。这三个其实还有另一种称呼叫做魔法方法.魔法方法顾名思义,就是总是被左右各两个下划线包围的方法称为魔法方法,...原创 2020-04-18 18:01:42 · 961 阅读 · 0 评论 -
贪心(婪)算法之哈夫曼编码(Huffman code)学习笔记(Python版)
前言(可省略。):哈夫曼编码可以很有效的压缩数据:通常可以节省 20%~90%的空间,具体压缩率依赖于数据的特性。我们将待压缩数据看做字符序列。根据每个字符的出现频率,哈夫曼贪心算法构造出字符的最优二进制表示。假定我们希望压缩一个10个字符的数据文件。下表给出了文件中所出现的字符和它们的出现频率。也就是说,文件中只出现了6个不同字符,其中字符a出现了45 000次。abcd...原创 2020-04-16 17:25:54 · 2684 阅读 · 2 评论 -
Python之一行代码的终极“姿势”(干货!)
Python的简洁之美,一行代码也能玩出姿势的花样~~~~~1.一行代码交换参数a, b的值a, b = b, a2.一行代码反转list(列表)[v1,v2,v3][::-1]#输出结果为:[v3,v2,v1]3.一行代码list(列表)去重(元素)set([1,2,2,3,3,3,4])#输出结果为:{1, 2, 3, 4}4.一行代码求list(列表)中的最大值ma...原创 2020-04-16 12:30:16 · 771 阅读 · 0 评论 -
Python list 常用操作汇总(干货!)
list 列表常用操作汇总1、list定义2、list负数索引3、list切片4、list增加元素5、list删除元素6、list搜索7、list运算符8、使用join链接list成为字符串9、list分割字符串10、list的映射11、dict(字典)中的解析(返回的为list形式)12、list过滤1、list定义list = ['a', 'b', '123', 'z', '456']p...原创 2020-04-15 16:48:33 · 1859 阅读 · 0 评论 -
Python之Requests_html库入门篇(含实例:爬取51jobs网站python岗位信息 )
Requests_html库入门学习安装基本用法获取网页获取连接获取元素元素内容实例 爬取51jobs网站有关Python工作的信息requests_html官方链接安装pip install requests_html如果还不会pip安装的请看这篇文章——>pip 安装,更新,卸载,查看模块方法Note: requests-html只支持Python 3.6及更新的版本,所以使用...原创 2020-04-15 10:46:19 · 1881 阅读 · 2 评论 -
Python 数据可视化生成词云 WordCloud
演示:不罗嗦,直接先上代码。from wordcloud import WordCloudimport jiebafrom matplotlib import pyplot as pltfrom PIL import Imageimport numpy as nppath = r'E:\123\教程' #文本路径path_ph = r'E:\123\教程' #词云背景模板...原创 2020-04-14 10:52:29 · 1132 阅读 · 1 评论 -
Python之彻底学会字典(干货!)
干货!!!Python 字典一、创建和访问字典(1).创建字典:(2).访问字典:二、修改、添加和删除字典(1).修改字典:(2).添加字典:(3).删除字典:三、字典键的特性(1).不允许同一个键出现两次。创建时如果同一个键被赋值两次,后一个值会被记住。(2).键必须不可变,所以可以用数字,字符串或者元组充当,而用列表就不行。四、字典内置函数和方法(1).内置函数(2).内置方法Python ...原创 2020-04-12 12:21:00 · 4844 阅读 · 2 评论 -
学Python了还不会异常处理吗?这一篇让你彻底掌握它
你不可能总是对的因为我们是人,不是神,所以经常会犯错误。当然程序员也不例外,就算是经验丰富的码农,也不能保证写出来的代码百分之百没有任何问题(要不哪来的那么多的漏洞)。另外,作为一名合格的程序猿,在编程的时候一定要意识到一点,那就是永远不要相信你的用户。要把它们想象成熊孩子,把它们想象成黑客,这样写出来的程序自然会更加的安全和稳定。那么既然程序总会出错出问题,就应该学会用适当的方法去解决问题...原创 2020-04-09 12:24:50 · 509 阅读 · 1 评论 -
都什么时代了还在裸爬吗,快用IP代理池吧!
当你经常爬取对方的网站,对方看你,呦这家伙频繁访问也太快了吧,肯定是个爬爬,得把他的IP封了,看他还怎么爬!因此,这次教你怎么伪装自己的 IP 地址别让对方轻易的就把你给封掉。那怎么伪装呢?那接下来就是学习Python的正确姿势了!其实对于Python来说,使用代理代理IP访问是很简单的。就拿我们经常使用的requests库来说,使用代理IP如下:import requests#定义...原创 2020-04-08 10:57:12 · 2523 阅读 · 5 评论 -
Python之将py文件(一个或多个)打包成exe可执行文件----pyinstaller
Python之将py文件(一个或多个)打包成exe可执行文件----pyinstaller一、首先,先安装pyinstallerwin+R,输入cmd,回车进入后输入pip install pyinstaller注:我是因为安装完了pyinstaller所以会出现这样的情况,正常安装情况时需要等待的。二、使用pyinstaller进行打包命令格式:pyinstaller [主文件] ...原创 2020-04-06 16:20:33 · 6805 阅读 · 4 评论 -
Python3 File 方法总结 (超详细!)
Python3 File 方法总结目录1. file.close() --- 关闭一个已打开的文件2. file.flush() --- 用来刷新缓冲区的3. file.fileno() --- 返回一个整型的文件描述符(file descriptor FD 整型)4. file.isatty() --- 检测文件是否连接到一个终端设备,如果是返回 True,否则返回 False5. file.n...原创 2020-04-05 22:13:38 · 4305 阅读 · 0 评论 -
这回终于知道了if __name__=='__main__'干嘛的了
相信很多人都去阅读过别人的代码(注:通常通过阅读比你牛的人写的代码,会让你的技术水平飞速提高),在阅读代码时,你会发现很多代码中都有 if __name__==’__main__’ 这么一行代码语句,但是不知道有什么用?因此下面我来详细的解答一下:先举个例子,一般写完代码要先测试一下:# testone.pydef t1(): print('hello')def t2(): ...原创 2020-04-03 14:15:17 · 4786 阅读 · 3 评论 -
Python 给下载文件显示进度条和下载时间(一看就会!)
其实实现它方法很简单,这里我写了个进度条的模块,其中还附带上了运行时间也就是下载时间了。该模块调用了三个库:1.os 2.requests 3.time话不多说,先上代码!!!.# 进度条模块def progressbar(url,path): if not os.path.exists(path): # 看是否有该文件夹,没有则创建文件夹 os.mkdir...原创 2020-04-01 16:27:00 · 10726 阅读 · 1 评论 -
Pycharm自定义更换背景图,来给代码加个PS~~~
来给代码加个PS!首先打开我们的Pycharm,然后通过快捷键Ctrl+Shift+A打开搜索,然后输入set background image,回车后就是进行背景更换了。步骤如下:1、会弹出个Background Imag 的窗口2、再Image框里设置你想用的图片地址3、下面这个Opacity这个选项是用来调整图片的透明度的,设置自己喜欢的数值就好,(注意数值越大,写代码越专注,...原创 2020-03-31 11:54:38 · 2658 阅读 · 3 评论 -
Python之何为yield关键字(生成器)?
yield 关键字yield顾名思义,它是python3中33个关键字中的一个,也是非常重要的一个关键字。yield与生成器息息相关,yield <==> 生成器 所以知道了什么是生成器,yield也自然而然地懂了。那什么是生成器呢?1.生成器是一个不断产生值的函数。2.包含yield语句的函数是一个生成器。3.生成器每次产生一个值(yield语句),函数被冻结,知道再...原创 2020-03-30 14:48:27 · 273 阅读 · 0 评论 -
pip 安装,更新,卸载,查看模块方法
pip 安装,更新,卸载模块使用方法首先打开命令提示符win+R 输入cmdpip 安装在命令行输入pip install PackageNamepip 更新在命令行输入pip install -U PackageNamepip 卸载在命令行输入pip uninstall PackageName上一篇文章———>教你彻底学会递归——《进阶篇》...原创 2020-03-29 20:51:59 · 2848 阅读 · 0 评论 -
Python正则表达式详解 (超详细,看完必会!)
正则表达式详解正则表达式 英文名称叫 Regular Expression简称RegEx,是用来匹配字符的一种工具,它常被用在网页爬虫,文稿整理,数据筛选等方面,最常用的就是用在网页爬虫,数据抓取。一、正则表达式的各种符号解释(来自维基百科)~~~是不是感觉太多了,因此我将常用的整理出来了二、进行逐个详解1.首先导入模块import re2.匹配多种可能 使用 []...原创 2020-03-28 14:02:26 · 67085 阅读 · 28 评论 -
scrapy基础操作教程(实例)
scrapy教程我通过一个爬取百度贴吧hello吧页面源码的简单爬虫来讲解Scrapy架构(5+2结构)Scrapy Engine(引擎):负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯,信号、数据传递等。Scheduler(调度器):它负责接受引擎发送过来的Request请求,并按照一定的方式进行整理排列,入队,当引擎需要时,交还给引擎。...原创 2020-03-27 17:00:15 · 4644 阅读 · 0 评论 -
Python之format用法详解
Python之format用法详解一、填充1.无参(1)print('{} {}'.format('hello','world'))hello world2.无参(2)print('{0} {1}'.format('hello','world'))hello world3.无参(3)print('{1} {0} {1}'.format('hello','world')...原创 2020-03-21 11:49:37 · 57251 阅读 · 16 评论