python
chenpe32cp
大道至简
展开
-
win10上安装tensorflow时报错 ImportError: DLL load failed
参考该博客第一种方法问题:先去https://visualstudio.microsoft.com/zh-hans/downloads/?rr=https%3A%2F%2Fsocial.msdn.microsoft.com%2FForums%2Fvstudio%2Fen-US%2Fe653a57a-bc32-4134-87bf-df33058f0531%2Fdownload-micro...转载 2020-04-05 12:17:19 · 304 阅读 · 0 评论 -
关于python中 !@property的使用
转自本文python中 @property考察Student类:class Student(object): def __init__(self, name, score): self.name = name self.score = score当我们想要修改一个Student的scroe属性时,可以这么写:s = Stu...转载 2020-03-15 13:58:55 · 137 阅读 · 0 评论 -
Conda 常用命令
本文转载于这里,以作备忘。感谢conda常用的命令。 1)conda list 查看安装了哪些包。 2)conda env list 或 conda info -e 查看当前存在哪些虚拟环境 3)conda update conda 检查更新当前conda3、创建Python虚拟环境。 使用 conda create -n your_env_name pyt...转载 2020-03-05 18:06:31 · 251 阅读 · 0 评论 -
如何在vscode使用相对路径
找了半天,好多方法都不好使,最终使用下面的方法解决,在程序里加入两行代码:import os, sysos.chdir(sys.path[0])原创 2020-03-04 19:16:42 · 1353 阅读 · 1 评论 -
python 单下划线变量与双下划线变量的区别
1、前后都有双下划线-特殊变量变量名类似__xxx__的,也就是以双下划线开头,并且以双下划线结尾的,是特殊变量,特殊变量是可以直接访问的,不是private变量,所以,不能用__name__、__score__这样的变量名2、前面双下划线-私有变量在Python中,实例的变量名如果以__开头,就变成了一个私有变量(private),只有内部可以访问,外部不能访问。双下划线开头的实例变量是...转载 2019-11-23 16:36:25 · 350 阅读 · 0 评论 -
notepad++ 设置运行python和代码自动补全
在notepad++中按F5,弹出运行界面,然后输入:cmd /k C:\Python36\python.exe"$(FULL_CURRENT_PATH)" & PAUSE & EXIT解释:cmd /k C:\Python36\python.exe: 表示打开Cmd窗口,运行/k后边的命令,并且执行完毕后保留窗口。此处即C:\Python36\python.exe(...原创 2019-11-17 11:12:02 · 1670 阅读 · 0 评论 -
什么是协程?
单线程+异步I/O现代操作系统对I/O操作的改进中最为重要的就是支持异步I/O。如果充分利用操作系统提供的异步I/O支持,就可以用单进程单线程模型来执行多任务,这种全新的模型称为事件驱动模型。Nginx就是支持异步I/O的Web服务器,它在单核CPU上采用单进程模型就可以高效地支持多任务。在多核CPU上,可以运行多个进程(数量与CPU核心数相同),充分利用多核CPU。用Node.js开发的服务...原创 2019-11-16 23:00:31 · 163 阅读 · 0 评论 -
lightGBM使用案例
转载于文本xgboost:https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/lightgbm的两种使用方式lightgbm#!/usr/bin/env python2# -*- coding: utf-8 -*-"""C...转载 2018-09-28 10:43:26 · 6991 阅读 · 1 评论 -
iterrows(), iteritems(), itertuples()对dataframe进行遍历
转载于此iterrows(): 将DataFrame迭代为(insex, Series)对。 itertuples(): 将DataFrame迭代为元祖。 iteritems():将DataFrame迭代为(列名, Series)对 现有如下DataFrame数据:import pandas as pdinp = [{'c1':10, 'c2':100}, {'c1':11...转载 2018-11-16 15:49:36 · 11438 阅读 · 0 评论 -
python如何实现基于user_id分组将item多行转为一行(类似于hive中的concat_ws功能)
举例:pandas中,将如下形式的data1转换为 data2?data1:user item A a A b A c B a B d data2:user item A [a,b,c] B [a,d] hive中可直接使用concat_ws函数,python中暂时没有找到可以直接用的函数,...原创 2018-12-20 21:32:50 · 902 阅读 · 0 评论 -
python ~的误用
一直以为"~",是用来对布尔值取反,却忘记了该操作其实是按位取反。以下程序为误用,之前一直在误用,我这个菜鸡!flag = 1if ~flag: print("OK")这样写程序依然会输出 “OK”要这么写才行:flag = 1if not flag: print("OK")...原创 2019-06-15 11:53:33 · 139 阅读 · 0 评论 -
用sklearn 保存和加载模型的两种方法
使用pickle模块或者sklearn内部的joblib#####方法一####import picklefrom sklearn.svm import SVCfrom sklearn import datasets # 定义分类器svm = SVC() # 加载iris数据集iris = datasets.load_iris()# 读取特征X = iris.data...转载 2018-09-28 10:30:44 · 10479 阅读 · 0 评论 -
pandas 使用read_csv读取文件时产生错误:EOF inside string starting at line
解决方法:使用参数 quotingdf = pd.read_csv(csvfile, header = None, delimiter="\t", quoting=csv.QUOTE_NONE, encoding='utf-8')原创 2018-10-12 15:16:58 · 12438 阅读 · 2 评论 -
利用pandas对dataFrame进行绘图并保存
https://www.jb51.net/article/120414.htm对dataframe绘图并保存:ax = df.plot() fig = ax.get_figure()fig.savefig('fig.png')可以制定列,对该列各取值作统计:label_dis = df.label.value_counts()ax = label_dis.plot(tit...转载 2018-09-07 14:43:17 · 19779 阅读 · 0 评论 -
pandas获取groupby分组里最大值所在的行方法
本文转载自此文,感谢楼主的耐心分享如下面这个DataFrame,按照Mt分组,取出Count最大的那行 1 2 3 4 import pandas as pd df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s...转载 2018-09-07 11:02:24 · 14544 阅读 · 10 评论 -
python自动发邮件总结
本文转载于此链接,感谢作者的耐心讲解(有些小错误,已修复)python发邮件需要掌握两个模块的用法,smtplib和email,这俩模块是python自带的,只需import即可使用。smtplib模块主要负责发送邮件,email模块主要负责构造邮件。smtplib模块主要负责发送邮件:是一个发送邮件的动作,连接邮箱服务器,登录邮箱,发送邮件(有发件人,收信人,邮件内容)。email模...转载 2018-09-07 10:57:40 · 881 阅读 · 0 评论 -
pandas对数据中的某一列进行归一化处理
#####归一化函数#####max_min_scaler = lambda x : (x-np.min(x))/(np.max(x)-np.min(x))data['use_dates_month'].apply(max_min_scaler)#这种写法是错误的正确的写法是:data[['use_dates_month']].apply(max_min_scaler) ...原创 2018-09-06 14:21:34 · 29722 阅读 · 5 评论 -
pandas groupby 分组取每组最大或最小的topN条记录
本文转自这里直接上例子。import pandas as pddf = pd.DataFrame({'class':['a','a','b','b','a','a','b','c','c'],'score':[3,5,6,7,8,9,10,11,14]})df: class score0 a 31 a 52 b 63 ...转载 2018-12-27 15:08:17 · 17107 阅读 · 2 评论 -
python 画饼图时如何调整图中字体的大小
本文转载自这里from matplotlib import pyplot as plt #调节图形大小,宽,高plt.figure(figsize=(6,9))#定义饼状图的标签,标签是列表labels = [u'第一部分',u'第二部分',u'第三部分']#每个标签占多大,会自动去算百分比sizes = [60,30,10]colors = ['red','yellowgr...转载 2019-02-21 17:50:37 · 31848 阅读 · 4 评论 -
python pandas 中如何禁用科学计数法显示
加入一行代码即可pd.set_option('display.float_format',lambda x : '%.2f' % x)原创 2019-02-22 18:03:35 · 29940 阅读 · 12 评论 -
如何对字典(或元组列表),先按值排序,再按照键进行排序?
对于字典:d = {'a':5,'b':4,'d':8,'c':1,'e':4}想得到d = {'d':8,'a':5,'b':4,'e':4,'c':1}可通过下列命令实现:sorted(d.items(),key=lambda x:(-x[1],x[0]))-x[1]表示先对值按照逆序排序,x[0]表示再对键按照正序排序。同理,如果是元组列表L = [(...原创 2019-10-07 22:55:45 · 2999 阅读 · 2 评论 -
python中的cls到底指的是什么,与self有什么区别?
https://blog.csdn.net/sinat_33718563/article/details/81298785作者:秦风链接:https://www.zhihu.com/question/49660420/answer/335991541来源:知乎转载 2019-08-02 13:35:42 · 2782 阅读 · 0 评论 -
python2中的除法
在python2中编程时,要想使用python3中的除法(/),必须在脚本最开头加上:from __future__ import division原创 2019-07-10 15:50:50 · 1036 阅读 · 0 评论 -
如何提高github代码的下载速度——曲线救国方案
本文转载于这里,感谢楼主分享!好人一生平安~因为大家都知道的原因,在国内从github上面下载代码的速度峰值通常都是20kB/s。这种速度对于那些小项目还好,而对于大一些的并且带有很多子模块的项目来讲就跟耽误时间。而常见的的方法无非就是修改HOST或者挂VPN,实际用起来并不稳定。这里提供一种新的方法,下载速度可以达到 1~2MB/s1. 利用开源中国提供的代码仓库标题已经说的很清楚了,...转载 2019-07-08 21:31:51 · 469 阅读 · 0 评论 -
python 对任意文件(jpg,png,mp3,mp4)base64的编码解码
最近调用腾讯ai开发平台的语音合成接口,将文字转为语音数据后,得到的语音格式为base64,那么啥是base64编码,又如何将其转为mp3格式呢?作为一名面向百度的编程爱好者,看完一篇博客后就秒懂了。直接搬运过来,感谢作者分享。Python的base64函数是内置函数,是一种用64个字符来表示任意二进制数据的方法。用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱...转载 2019-06-27 18:37:35 · 4739 阅读 · 0 评论 -
使用Python操作音频文件,提取音频特征
http://bigsec.net/b52/scipydoc/wave_pyaudio.htmlhttps://blog.csdn.net/Xwei1226/article/details/83781157转载 2019-07-02 16:24:33 · 3999 阅读 · 0 评论 -
windows下如何批量跑多个python脚本
可以使用 subprocess 模块,关于subprocess.Popen,这里有个比较好的介绍:https://www.cnblogs.com/Security-Darren/p/4733368.htmlhttps://www.cnblogs.com/lincappu/p/8270709.htmllinux下可以直接使用nohub。关于输出文件的重定向:import sub...转载 2019-06-26 17:11:31 · 1996 阅读 · 0 评论 -
python 图片 数组到二进制的互相转换
本文转自这里需要导入以下包,没有的通过pip安装import matplotlib.pyplot as pltimport cv2from PIL import Imagefrom io import BytesIOimport numpy as np1.图片和数组互转# 图片转numpy数组img_path = "images/1.jpg"img_data = cv2.i...转载 2019-06-19 11:58:08 · 12664 阅读 · 0 评论 -
UnicodeEncodeError: 'ascii' codec can't encode...错误
遇到这个错误,尝试两种解决方法:第一种: 在程序的最开头,写入下面几行代码import ioimport syssys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')第二种: 如果是write时报错,二话不说,试试codecs模块吧import codecsfh...原创 2019-05-27 19:28:57 · 1070 阅读 · 0 评论 -
python 自动发送邮件报表,正文插入图片,带附件
# -*- coding: utf-8 -*-"""Created on Wed Aug 15 17:44:33 2018@author: cp"""from email.mime.text import MIMETextfrom email.mime.multipart import MIMEMultipartfrom email.mime.image import MIME...原创 2018-09-11 14:51:02 · 9898 阅读 · 0 评论 -
python pandas如何基于某一列修改某一列的值
df = DataFrame({"a":[1,2,3],"b":[4,5,6],"c":[7,8,9]})dfOut[12]: a b c0 1 4 71 2 5 82 3 6 9df.loc[df.a>=2,'b'] = 'new_data'dfOut[14]: a b c0 1 4 7...原创 2018-08-29 11:23:50 · 79710 阅读 · 14 评论 -
pandas to_csv输出到文件的中文是乱码的问题
https://blog.csdn.net/glory1234work2115/article/details/53913951使用pandas的DataFrame to_csv方法实现csv文件输出,但是中文乱码,已验证的正确的方法是:df.to_csv("cnn_predict_result.csv",encoding="utf_8_sig") 关于utf-8与utf_8_si...转载 2018-08-28 16:26:41 · 12820 阅读 · 0 评论 -
使用python + selenium爬取淘宝商品信息
因为淘宝是动态网页,很多商品的数据是动态加载的,所以我们就无法使用爬取静态页面的方式来抓取淘宝商品信息。这里我使用了自动化测试工具selenium来爬取动态页面的商品信息。这里有几个需要注意的地方,因为淘宝首页打开首先是二维码登录界面,所以为了直接通过程序实现登录,我们要利用指令find_element_by_id('J_Quick2Static').click(原创 2017-01-08 10:25:13 · 8911 阅读 · 3 评论 -
基于情感字典的文本情感极性分析
情感极性分析是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑。 目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法。 数据准备 1.情感词典及对应分数 词典来源于BosonNLP数据转载 2017-09-02 15:36:59 · 15848 阅读 · 8 评论 -
pandas将类别属性转化为数值属性的方法
原文地址 离散特征的编码分为两种情况: 1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码 2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3} 使用pandas可以很方便的对离散型特征进行one-hot编码import pandas as pddf = pd.Data转载 2017-07-19 22:48:00 · 34961 阅读 · 0 评论 -
对DataFrame列名进行更改的两种方式
import pandas as pdfrom pandas import DataFramedata = DataFrame([[1,2],[3,4]],index=[1,2],columns=['a','b'])如何改变data的列名为’d’,’e’呢?有两种方法: 1. data.columns = [‘d’,’e’] 2. data.rename(columns={‘a’:’d’,’原创 2017-07-30 23:12:13 · 4909 阅读 · 0 评论 -
python3中无法导入cPickle
python3中cPickle模块已经更名为_pickle,所以在python3中导入时可以使用:import _pickle as cPickle然而在python3中,直接使用pickle 模块更为方便。原创 2017-07-16 22:00:59 · 20718 阅读 · 1 评论 -
处理不平衡数据集的八种策略
原文 http://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/ 相关连接(python) https://github.com/scikit-learn-contrib/imbalanced-learn ` http://ww转载 2017-05-21 15:47:41 · 2577 阅读 · 0 评论 -
python读取大文件
1.正常情况下,使用python读取文件的方式比较简单,可以使用如下两种方式:with open(file_path,"r") as f: print(f.read())或者是逐行输出:with open(file_path,"r") as f: for line in f.readlines(): print(line)这里需要注意:read() ,readline原创 2017-04-23 10:37:21 · 1075 阅读 · 0 评论 -
对python字典的排序
使用sorted函数对字典进行排序包含两种情况,一种事对keys进行排序,一种是对value进行排序sorded函数包含三分参数:sorted(iterable,key,reverse)iterable是可迭代对象,可以是dict.items(),dict.keys()等,key是一个函数,用来选取参与比较的元素,reverse用来指点是正序还是逆序。 (1)对key进行排序:dict={'d原创 2017-04-21 16:07:16 · 584 阅读 · 0 评论