python
tantao666
这个作者很懒,什么都没留下…
展开
-
python3.8 安装pyqt5 报错
直接使用pip install PyQt5 -i https://mirrors.aliyun.com/pypi/simple来安装报错如下后来各种补c1文件,科学上网,到官网找wheel没找到3.8版本的。最终,通过指定低版本解决问题原创 2021-12-23 18:16:35 · 1544 阅读 · 0 评论 -
python 安装包报错Microsoft Visual C++ 14. is required
使用pip install的时候遇到 *** is not a supported wheel on this platform 问题的解决今天在windows系统下安装pymssql的时候遇到了以下问题:在这里插入图片描述一脸懵。。。。找了一圈发现居然是名字的问题。怎么改呢,往下看。1、首先通过pip检查工具检查你电脑的接受安装的标签:这个地方需要根据你的电脑使用命令:AMD64pythonimport pip._internalprint(pip._internal.pep4原创 2021-09-23 19:34:49 · 317 阅读 · 0 评论 -
json str 相互转化
str 转json 时,会把“ 转' ,False 转false True 转 true ,所以json转str时,把相应的转回来就好了原创 2020-05-14 14:29:02 · 810 阅读 · 0 评论 -
xpath 少见常用 兄弟节点 父子节点
<div> <a id="1" href="www.baidu.com">我是第1个a标签</a> <p>我是p标签</p> <a id="2" href="www.baidu.com">我是第2个a标签</a> <a id="3" href="www.baidu.com">我是第3个a标签</a> <a i...转载 2020-05-13 10:48:10 · 627 阅读 · 0 评论 -
pd.read_json 匪夷所思的替换
先上问题j_index='{"0":{"a":1,"b":2},"1s":{"a":1,"b":2}}'j_index3="{'0':{'a':1,'b':2},'1':{'a':1,'b':2}}"意思差不多就是j_index 和j_index3 是不同的,一定要区分' 和"下面是转载别人记录的read_json 常用用法'records': list like[{column->value},...,{column->value}]...原创 2020-05-13 10:10:22 · 2012 阅读 · 0 评论 -
pyinstaller 报错 AttributeError: 'str' object has no attribute 'decode'
之前用pyinstaller时都没碰上这个问题,今天不知道什么原因就突然报这个错即使我拿之前生成过的py文件,也时同样报错解决方法:上图已经写的很清楚了,D:\anaconda\Lib\site-packages\PyInstaller\compat 的427行报错把427行的 out = out.decode(encoding)改为 out = out ,然后问题就...原创 2020-01-06 13:12:54 · 3933 阅读 · 3 评论 -
Python机器学习(六)-XGBoost调参
转自:https://mp.weixin.qq.com/s?__biz=MzI2ODY5NjI2Mg==&mid=2247483759&idx=1&sn=69aefa04b283eba638854993e0384cb4&chksm=eaeaeec6dd9d67d0当了建了一个模型,为了达到最佳性能,通常需要对参数进行调整。这样你的模型,才会像一碗加了辣油精心调制...转载 2019-04-05 13:36:31 · 4493 阅读 · 0 评论 -
python环境下xgboost的安装与使用
转载自:https://www.cnblogs.com/viczhangyuetao/p/7766940.htmlxgboost是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。在数据科学方面,有大量kaggle选手选用它进行数据挖掘比赛,其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面,xgboost的分...转载 2019-04-05 13:34:06 · 287 阅读 · 0 评论 -
信用卡客户画像(年龄,性别,收入,支出 和信用卡种的关系)
import osimport pandas as pdos.chdir(r'H:\2019-2-3新华书店笔记以及资料\资料\HW5')card=pd.read_csv(r"card.csv",encoding="gbk") #读取数据disp=pd.read_csv(r"disp.csv",encoding="gbk")clients=pd.read_csv(r"clients....原创 2019-03-11 15:13:31 · 5390 阅读 · 1 评论 -
行车出险客户画像(是否出险和年龄、驾龄、性别、婚姻状态等变量之间的关系)
import osimport pandas as pdos.chdir(r'H:\2019-2-3新华书店笔记以及资料\资料\HW4')au=pd.read_csv(r'auto_ins.csv',encoding='gbk')au.head() #简单查看数据 EngSize Age Gender Marital exp Owner ...原创 2019-03-11 15:12:27 · 941 阅读 · 2 评论 -
二手房房价预测(置信度)
import osos.chdir(r"E:\BaiduNetdiskDownload\6inference")import pandas as pdhouse_price_gr = pd.read_csv(r'house_price_gr.csv', encoding='gbk')house_price_gr.head()#先查看一下数据dis_name rate 0...原创 2019-02-26 10:36:17 · 1000 阅读 · 0 评论 -
pandas map(), apply(), applymap() 区别解析
转自 https://blog.csdn.net/weixin_39791387/article/details/81487549文章目录 基础 map()方法 apply() 方法 背景介绍: applymap() 总结: 基础以下操作基于python 3.6 windows 10 环境下 通过将通过实例来演示三者的区别...转载 2019-04-11 18:49:56 · 252 阅读 · 0 评论 -
LightGBM——提升机器算法(图解+理论+安装方法+python代码)
转自:https://blog.csdn.net/huacha__/article/details/81057150前言LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。在竞赛题中,我们知道XGBoost算法非常热门,它是一种优秀的拉动框架,但是在使用过程中,其训练耗时很长,内存占用比较大。在2017年年1月...转载 2019-04-10 00:30:11 · 1095 阅读 · 0 评论 -
二手房房价影响因素分析
数据探索,数据预处理,数据可视化观察数据分布,处理异常值,缺失值# coding: utf-8"""dist-所在区roomnum-室的数量halls-厅的数量AREA-房屋面积floor-楼层subway-是否临近地铁school-是否学区房price-平米单价"""import pandas as pdimport numpy as npimport mat...原创 2019-04-18 15:35:26 · 2398 阅读 · 2 评论 -
金融贷款预测
本数据来源于https://tianchi.aliyun.com/course/courseConsole?spm=5176.12282070.0.0.764c290a2RIpBY&courseId=192&chapterIndex=10§ionIndex=1本是天池的课堂,不过讲的不是太清楚,所以后面的变量控制,清洗数据都是按照自己的想法import p...原创 2019-04-19 20:58:59 · 488 阅读 · 0 评论 -
基于python中jieba包的中文分词中详细使用
为了教别人jieba库的使用,顺便自己把这个整理一下,记录下来,省的之后使用又来找资料jieba:中文分词比较好,但是英文分词就用其他的3种分词模式:精确模式,将句子精确地切开,不存在冗余,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义,有冗余;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于引擎分词jieba....转载 2019-05-06 22:45:02 · 2316 阅读 · 0 评论 -
scarpy 反爬之改ip改useragent
转载自https://www.cnblogs.com/rwxwsblog/p/4575894.html如何让你的scrapy爬虫不再被ban 前面用scrapy编写爬虫抓取了自己博客的内容并保存成json格式的数据(scrapy爬虫成长日记之创建工程-抽取数据-保存为json格式的数据)和写入数据库(scrapy爬虫成长日记之将抓取内容写入mysql数据库)。然而,这个爬虫的功能还是过...转载 2019-06-06 16:58:07 · 205 阅读 · 0 评论 -
《Learning Scrapy》(中文版)
序言第1章 Scrapy介绍第2章 理解HTML和XPath第3章 爬虫基础第4章 从Scrapy到移动应用第5章 快速构建爬虫第6章 Scrapinghub部署第7章 配置和管理第8章 Scrapy编程第9章 使用Pipeline第10章 理解Scrapy的性能第11章(完) Scrapyd分布式抓取和实时分析作者:SeanCheney链接:https://www.jianshu.co...转载 2019-07-03 17:09:36 · 566 阅读 · 0 评论 -
个人贷款违约预测模型
import osimport pandas as pdos.chdir('E:\BaiduNetdiskDownload\违约贷款案例')# ## 1.1导入数据loanfile = os.listdir()createVar = locals()for i in loanfile: if i.endswith("csv"): create...原创 2019-02-25 16:56:40 · 2274 阅读 · 3 评论 -
一些记在jupyter的笔记
斯坦福 吴恩达 机器学习原创 2019-02-20 10:38:37 · 723 阅读 · 0 评论 -
python 系统学习笔记(十二)---os os.path os.walk
转载 :https://blog.csdn.net/ychw365/article/details/8662062得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()返回指定目录下的所有文件和目录名:os.listdir()函数用来删除一个文件:os.remove()删除多个目录:os.removedirs(r“c:\python”)检验给出的路径是...转载 2019-02-20 10:28:44 · 203 阅读 · 0 评论 -
urllib.request
转载:https://blog.csdn.net/u010211479/article/details/66475183request=urllib.request.urlopen(url) '''这段代码是没错的,但是报错为这个 '''AttributeError: module 'urllib' has no attribute 'request'因为python3有时候不会将子模块自动导...转载 2018-06-17 20:34:01 · 399 阅读 · 0 评论 -
python爬虫
由于视频资料只有python2,所有python3爬虫在mooc学习的,:https://www.icourse163.org/search.htm?search=%E7%88%AC%E8%99%AB#/原创 2018-06-19 16:59:47 · 260 阅读 · 0 评论 -
python爬虫之post请求
转载自 :https://blog.csdn.net/weixin_40188147/article/details/78173695构建表单数据(在http://www.iqianyue.com/mypost实验)查看源代码,发现name属性值为“name”,密码对应的输入框中,name属性值为“pass”。因此构建表单的数据中要包含两个字段,字段名为“name”,“pass”,字段值设...转载 2018-07-29 01:47:28 · 2505 阅读 · 0 评论 -
Python3模块详解--老司机工具urllib模块详解之urllib.parse子模块
转载自 :https://blog.csdn.net/zly412934578/article/details/77776659This module defines a standard interface to break Uniform Resource Locator (URL) strings up in components (addressing scheme, networ...转载 2018-07-29 01:49:02 · 258 阅读 · 0 评论 -
Python format 格式化函数
转载 :http://www.runoob.com/python/att-string-format.html由于一直记不住format的格式,因为用的较少,保存xia下来,以后用的时候方便找Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。基本语法是通过 {} 和 : 来代替以前的 % 。format 函数可以接受不限...转载 2018-07-29 17:27:59 · 110 阅读 · 0 评论 -
python 系统学习笔记(十二)---os os.path os.walk
转载:https://blog.csdn.net/ychw365/article/details/8662062得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()返回指定目录下的所有文件和目录名:os.listdir()函数用来删除一个文件:os.remove()删除多个目录:os.removedirs(r“c:\python”)检验给出的路径是否...转载 2018-07-31 15:14:00 · 277 阅读 · 0 评论 -
使用requests.get下载大文件-Python
https://blog.csdn.net/abcd1f2/article/details/53322934当使用requests的get下载大文件/数据时,建议使用使用stream模式。当把get函数的stream参数设置成False时,它会立即开始下载文件并放到内存中,如果文件过大,有可能导致内存不足。当把get函数的stream参数设置成True时,它不会立即开始下载,当你使用i...转载 2018-07-28 00:09:25 · 708 阅读 · 0 评论 -
Python日期的加减等操作
转自;https://www.cnblogs.com/vampirejt/p/4159267.html 1. 日期输出格式化所有日期、时间的api都在datetime模块内。1. datetime => stringnow = datetime.datetime.now()now.strftime('%Y-%m-%d %H:%M:%S')#输出2012-03-05 ...转载 2018-08-18 16:04:12 · 172 阅读 · 0 评论 -
python 对EXCEL 读写改 的操作
转自: https://www.cnblogs.com/yunguoxiaoqiao/p/7592000.html注:本文部分内容摘自互联网,由于作者水平有限,不足之处,还望留言指正。) 面对疾风吧。 回首往昔,更进一步。 且随疾风前行,身后一许流星。 正文: 数据处理是Python的一大应用场景,而 Excel ...转载 2018-08-16 16:23:09 · 325 阅读 · 0 评论 -
python .format IndexError: tuple index out of range
这样写,没有问题x1=1x2=2y1=3y2=4c='xx{}xx{}xx{}xx{}'.format(x1,y1,x2,y2)print(c) 但是在format中引用就是报错x1=1x2=2y1=3y2=4c='xx{}xx{}xx{}xx{}'.format(x1,y1,x2,yy2=y2)print(c) ...原创 2018-08-30 16:46:56 · 1394 阅读 · 0 评论 -
Android adb input 命令介绍
来源:https://blog.csdn.net/soslinken/article/details/49587497input命令是用来向设备发送模拟操作的命令: 因为版本不同,input命令也有所不同 以下为Android 4.0的input命令:usage:input text <string> input keyevent <key code n...转载 2018-08-27 22:41:13 · 9135 阅读 · 0 评论 -
python 查看图片中颜色最多的颜色
这个办法算是剑走偏锋把,初学者,看了其他大佬的办法,那些库都不熟练,然后就想到了这个简单的办法,都是简单的库,比较容易理解。from scipy import statsfrom PIL import Imageimg = np.array(Image.open('autojump.png'))#读取图片duo=[]for img1 in img:#按行查看,每行中颜色最多的添...原创 2018-08-28 21:41:56 · 4585 阅读 · 0 评论 -
Python图像处理库PIL的基本概念介绍
转载:https://blog.csdn.net/icamera0/article/details/50647465这一节我们介绍一下PIL中的基本概念。PIL中所涉及的基本概念有如下几个:通道(bands)、模式(mode)、尺寸(size)、坐标系统(coordinate system)、调色板(palette)、信息(info)和滤波器(filters)。1、 通道每张图片...转载 2018-08-29 00:32:54 · 258 阅读 · 0 评论 -
python绘制多层饼状图
转自: https://blog.csdn.net/weixin_40198632/article/details/78749420s={'S0': 3, 'S1': 19, 'S2': 6, 'S3': 2}p={'P0': 1, 'P1': 5, 'P2': 16, 'P3': 8}将上面两个字典绘制在同一张饼状图中:代码如下:s={'S0': 3, 'S1': 19, '...转载 2018-09-18 15:06:22 · 1602 阅读 · 0 评论 -
windows下,在python中用matplotlib画多幅图时出现图形部分重叠的解决方案
转自: https://blog.csdn.net/mudooo/article/details/80048155问题:如图解决方案:1.tight_layout命令:主要用于自动调整绘图区的大小及间距,使所有的绘图区及其标题、坐标轴标签等都可以不重叠的完整显示在画布上。2.使用方法:fig.tight_layout()效果如图: 3.此外tight...转载 2018-09-18 15:07:07 · 3019 阅读 · 0 评论 -
splinter
转自:https://blog.csdn.net/qq471011042/article/details/79514908“selenium.common.exceptions.WebDriverException: Message: ‘geckodriver’ executable needs to be in PATH.”先来看这个错误的具体问题,找不到’geckodriver’ 的环境...转载 2018-10-30 17:15:02 · 318 阅读 · 0 评论 -
客户精准营销(RFM模型)
# ### 1. 导入数据import osimport pandas as pdtrad_flow=pd.read_csv(r'RFM_TRAD_FLOW.csv',encoding='gbk')trad_flow.head()transID cumid time amount type_label type 0 9407 10001...原创 2019-02-25 14:56:00 · 4033 阅读 · 1 评论 -
Fiddler 1-3
转载:https://blog.csdn.net/ohmygirl/article/details/178461991.为什么是Fiddler?抓包工具有很多,小到最常用的web调试工具firebug,达到通用的强大的抓包工具wireshark.为什么使用fiddler?原因如下:a.Firebug虽然可以抓包,但是对于分析http请求的详细信息,不够强大。模拟http请求的功能也不够,且fire...转载 2018-06-16 23:54:50 · 183 阅读 · 0 评论