python
醉糊涂仙
这个作者很懒,什么都没留下…
展开
-
【python基础】抽样
一、random.choice()随机返回一个数(1)choice() 方法返回一个列表,元组或字符串的随机项。二、random.choices()随机返回指定个数数据2.1 population:数据。2.2 k:选取次数(抽样次数可以大于总体数据个数)2.3 weights:相对权重。参数weights设置相对权重,它的值是一个列表,设置之后,每一个成员被抽取到的概率就被确...原创 2020-04-23 20:28:43 · 648 阅读 · 0 评论 -
python向hive中写入数据
1,读取数据2,创建外表from pyhive import hiveimport pandas as pdimport datetimefrom datetime import timedeltaimport time#获取Hive连接def getHiveConn(): conn = None try: conn = hive.Co...原创 2020-03-31 16:31:46 · 18501 阅读 · 0 评论 -
python操作HDFS
1,python连接hdfs2,python增删改查hdfs文件from hdfs.client import Client#获取HDFS连接def getHDFSConn(): client = None try: client = Client("http://20.58.32.8:50070", root = '/') except ...原创 2020-04-01 16:36:56 · 4173 阅读 · 1 评论 -
jupyter notebook导出ipynb格式文件为py文件
#name.ipynb为当前单元格所在工作簿文件名try: !jypyter nbconvert --to python name.ipynbexcept: pass原创 2020-04-01 08:52:36 · 3051 阅读 · 0 评论 -
向量的点乘(内积、数量积)和叉乘(外积、向量积)
参考博文:https://blog.csdn.net/dcrmg/article/details/52416832已知两个向量,1 点乘1.1 公式公式(1)公式(2)1.2 点乘几何意义参考博文:https://wenku.baidu.com/view/9f0428c52cc58bd63186bd68.html2 叉乘2.1 公式公式(1)...原创 2020-01-22 15:52:33 · 2958 阅读 · 0 评论 -
爬取金属价格
# -*- coding: utf-8 -*-import urllibimport sysimport pandas as pdfrom bs4 import BeautifulSoupimport simplejson as jsonimport importlibimportlib.reload(sys)#设置目标url,利用urllib.request.Reques...原创 2019-12-02 16:56:04 · 636 阅读 · 0 评论 -
minist数据格式转成图片
# -*- coding: utf-8 -*-import numpy as npimport structimport matplotlib.pyplot as pltimport osfilename = 'data_AI/MNIST/train-images.idx3-ubyte'binfile = open(filename , 'rb')buf = binfile.r...原创 2019-11-07 11:08:38 · 971 阅读 · 0 评论 -
module pandas has no attribute core
问题描述:笔者是在jupyter notebook里面import pandas as pd 时出现这种情况。有一个ipynb文件一直报这个错,而其它ipynb文件同样也有import pandas as pd却正常。猜测:import pandas会不会像线程池一样是有数量限制的,因为报错信息里有一个core字眼,跟CPU的核心数很像,而笔者的jupyter notebook里面...原创 2019-11-01 09:17:53 · 5705 阅读 · 3 评论 -
python画饼图
from pylab import mpl#显示中文,在Spyder下有效,在linux的jupyter notebook上无效,因为该机器为内网机器,没有SimHei.ttf语言包mpl.rcParams['font.sans-serif'] = ['SimHei']import matplotlib.pyplot as plt labels = [u'215V<=电压...原创 2019-10-29 17:55:55 · 1622 阅读 · 0 评论 -
python画概率分布图
import seaborn as snssns.kedplot(df, shade = True)原创 2019-10-29 17:49:08 · 8409 阅读 · 1 评论 -
DataFrame某一列按照条件筛选,另一列赋值
--电压小于95V或者大于110V并且是三相三线的数据vol_if_exception设置为1--判断条件无论大小一定要用括号括起来,不然会报错df.loc[((df.vol_avg_daily < 95) | (df.vol_avg_daily > 110)) & (df.wiring_mode == '2'), 'vol_if_exception'] = 1...原创 2019-10-29 16:47:08 · 17361 阅读 · 1 评论 -
DataFrame时间加减一段时间
--加一天df['data_date'] + pd.Timedelta(days=1)--减一天df['data_date'] - pd.Timedelta(days=1)原创 2019-10-29 11:22:15 · 7771 阅读 · 0 评论 -
python假设检验是否符合正态分布
ks检验特点是比较严格,基于的原理是CDF,理论上可以检验任何分布。from scipy.stats import kstest--data为数据集,μ为data的均值,δ为data的标准差kstest(data, 'norm', (μ,δ))Shapiro检验专门用来检验正态分布。from scipy.stats import shapiroshapiro(d...原创 2019-10-28 17:37:51 · 2987 阅读 · 0 评论 -
Python中的is
1, 在交互式环境下, 如果数字小则引用同一个对象, 如果数字大则重新分配空间创建两个对象:>>> a=2>>> b=2>>> a is b #数字较小True>>> a==bTrue>>> a=4444>>> b=4444>>> a is b #数字较大False>>> a==bTrue2, 在交互式环境下, 当数字比较大时, 又分为写在同一行和不在同一行:>>> a=原创 2017-09-24 20:13:55 · 373 阅读 · 0 评论 -
TypeError: unhashable type: 'slice'
只能用data[‘列名’]方式获取一列数据。但是当我们不想为列设置列名时怎么办呢??可以再读取数据时做文章:此时再用data[‘列名’]方式读取数据,失败了!!!此时由于读取数据时没有加数据头,所以其实0,1,2,3···是列索引,取数据时直接data[1]...原创 2018-11-02 16:40:22 · 65337 阅读 · 1 评论 -
dataframe转换成矩阵
x_train = pd.read_csv(‘data_input.csv’,header=None) #数据类型为dataframex_train.values #直接转成矩阵原创 2018-11-14 14:26:08 · 18014 阅读 · 2 评论 -
Python中的shape和reshape()
参考博文:https://blog.csdn.net/qq_28618765/article/details/78083895shape()和reshape()都是数组array中的方法shape()import numpy as npa = np.array([1,2,3,4,5,6,7,8]) #一维数组print(a.shape[0]) #值为8,因为有8个数据print...转载 2018-11-14 14:46:28 · 196387 阅读 · 11 评论 -
You are using pip version 10.0.1, however version 18.1 is available.
python -m pip install --upgrade pip 更新pip原创 2018-11-30 14:46:42 · 314 阅读 · 0 评论 -
Python安装cv2
pip3 install opencv-python如果报错:请升级,pip不会成功。升级命令:python -m pip install --upgrade pip原创 2018-11-30 14:54:07 · 2291 阅读 · 0 评论 -
Python画二维图和三维图
转载地址1:https://blog.csdn.net/frankfrankflb/article/details/79338632转载地址2:https://jingyan.baidu.com/article/90bc8fc8ae31acf653640cd0.html 二维图像 from matplotlib import pyplot as plt import n...转载 2018-12-12 11:39:05 · 23435 阅读 · 0 评论 -
No module named 'imblearn'
一,说明没有安装imbalanced-learn模块二,有网情况下直接执行命令pip installimbalanced-learn三,由于各种原因没法使用该命令的情况下(比如内外网络不通)(1)先在网络通的机器上执行命令pip installimbalanced-learn(2)然后执行pip showimbalanced-learn找到imblearn模块的安装位...原创 2019-07-18 14:32:11 · 29168 阅读 · 1 评论 -
matplotlib.pyplot的plt绘图不显示中文
(1)在python安装目录的Lib目录下创建ch.py文件#-*-coding:utf-8-*- def set_ch(): from pylab import mpl mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体 mpl.rcParams['axes.unicode_minus']...转载 2019-07-18 15:00:32 · 4831 阅读 · 0 评论 -
python连接hive配置
注:Python端所在服务器为centos6.8一,hive安装配置参考博文:https://blog.csdn.net/u010916338/article/details/89764877重要一点,hive是个客户端,不是集群,在hive所在节点必须执行如下命令:hive --service hiveserver2参考博文:https://blog.csdn.net/zha...原创 2019-07-25 18:45:27 · 7572 阅读 · 0 评论 -
Python无法读取hdfs,requests.exceptions.ConnectionError: HTTPConnectionPool(host='big08', port=50075): Ma
一,问题描述:在用python的hdfs库操作HDFS时,可以正常的获取到hdfs的文件from hdfs.client import Client#读取hdfs文件内容,将每行存入数组返回def read_hdfs_file(client,filename): #with client.read('samples.csv', encoding='utf-8', deli...原创 2019-07-26 12:51:57 · 3990 阅读 · 3 评论 -
Python连接hive报错Could not start SASL: Error in sasl_client_start (-4) SASL(-4): no mechanism available
Could not start SASL: Error in sasl_client_start (-4) SASL(-4): no mechanism available: No worthy mechs found (code THRIFTTRANSPORT): TTransportException('Could not start SASL: Error in sasl_client_st...原创 2019-07-26 18:11:24 · 11918 阅读 · 1 评论 -
python三目运算符
java三目运算符 int a = 1; String b = ""; b = a > 1? "执行表达式1":"执行表达式2" System.out.println(b)python三目运算符 b= 1 a = b if b else random.random() print(a)...原创 2018-10-26 14:53:48 · 146 阅读 · 0 评论 -
python迭代
一, 迭代list和tuple方式相同l1 = ['a1', 'a2', 'a3', 'a4', 'a5', 'a6', 'a7', 'a8', 'a9']for value in l1: print(value)输出:a1a2a3a4a5a6a7a8a9二, 迭代dict按键迭代>>> d = {'a': 1, 'b': 2, 'c...原创 2018-09-21 17:15:17 · 205 阅读 · 0 评论 -
python时间字符串转换成时间戳
data[‘second’] = data[‘second’].apply(lambda x:time.mktime(time.strptime(x,”%Y:%m:%d %H:%M:%S:%f”)))原创 2018-08-31 10:50:55 · 2654 阅读 · 0 评论 -
python多核多进程
1、多线程与多进程之前OS课学过…..in general,线程是比进程低一级的调度单位。一个进程可以包含多个进程。线程之间的切换相对于进程之间更为方便,代价也更低。所以讲道理多线程的效率比多进程是要高的。Linux自从2.6内核开始,就会把不同的线程交给不同的核心去处理。Windows也从NT.4.0开始支持这一特性。【ref:http://blog.csdn.net/del...转载 2018-08-27 19:01:22 · 7528 阅读 · 3 评论 -
python画图把时间作为横坐标
1需要将时间字符串转换成datetime类型,语法:data[‘time’] = pd.to_datetime(data[‘time’]) 2,将时间列设置成索引列data.set_index(‘time’) 3,画图分两种 (1)matplotlib.pyplot方式 打印某一列数据,直接data[‘some_columns’].plot(),会自动将时间作为横坐标 (2)pych...原创 2018-08-27 17:45:48 · 57163 阅读 · 6 评论 -
Python 拷贝对象(深拷贝deepcopy与浅拷贝copy)
copy.copy 浅拷贝 只拷贝父对象,不会拷贝对象的内部的子对象。copy.deepcopy 深拷贝 拷贝对象及其子对象import copya = [1, 2, 3, 4, ['a', 'b']] #原始对象b = a #赋值,传对象的引用c = copy.copy(a) #对象拷贝,浅拷贝d = copy.deepcopy(a) #对象拷贝,深拷贝a.append(...转载 2018-08-16 19:40:51 · 888 阅读 · 0 评论 -
AttributeError: 'DataFrame' object has no attribute 'second'
解析:python不是面向对象的,而是基于对象的,什么意思?就是啥都是对象,不需要new,哪怕写了一个变量,也是一个对象 本例中遇到需要传一个dataframe作为一个参数给fiat.fiat_feature(packet, time)方法,相当于传的是该对象的地址,指针,后面的操作直接改变了原来的对象,所以后来在传参时先做一个拷贝packet = copy.deepcopy(all_packe...原创 2018-08-16 19:13:23 · 8584 阅读 · 1 评论 -
python类继承需要注意的问题
1,子类不会去调用父类中的init方法 2,可以多重继承 3,如果多个父类中有相同的方法,则按照顺序调用列表中第一个继承的父类中的方法 4,子类调用父类方法,需要用类名调用该方法,并且该方法的参数必须要带上self原创 2017-09-15 21:55:23 · 768 阅读 · 0 评论 -
Python对象中的属性为什么可以临时增加
class Employee: empCount = 0 def displayCount(self): print("hi") def __init__(self, name, salary): print("初始化!") self.name = name self.salary = salary解析: self原创 2017-09-15 21:25:24 · 1162 阅读 · 0 评论 -
TypeError: can only concatenate tuple (not "str") to tuple(python 元组只有一个元素需要加逗号)
例1:a = ("a", "b", "d", "f")b=("a",)c = a + bprint(c)例2:a = ("a", "b", "d", "f")b=("a")#这里没有加逗号,编译不会报错,但是元组拼接的时候会报错c = a + bprint(c)原创 2017-09-15 19:47:23 · 36404 阅读 · 0 评论 -
Python语言的适用范围
1,爬虫 2,人工智能用的是Python 3,phoenix(hbase的可视化工具)的命令用的都是python脚本原创 2017-09-16 14:07:05 · 1656 阅读 · 0 评论 -
python关键字null
python没有null关键字,和null效果相同的是None原创 2018-08-31 17:10:57 · 2777 阅读 · 0 评论 -
什么是脚本,什么是脚本语言
简言之:解释执行的代码就是脚本 脚本执行是靠解释执行.什么是解释执行?解释执行不用编译,解析一段代码就执行一段代码,解释器将代码解释成系统指令,系统指令可以理解成汇编语言,再转换成机器码. 非解释程序:以Java为例,Java不是脚本语言,执行流程如下: 脚本语言处于的位置就类似于Java字节码的位置,但是它的好处是可以打开阅读,而字节码却不行 综上,总结两点: 1,脚本语言解释执行...原创 2018-09-04 09:28:32 · 12950 阅读 · 0 评论 -
python对一列数据转换类型(可用于取整)
data[‘second’] = data[‘second’].astype(int)原创 2018-09-04 16:21:03 · 24609 阅读 · 7 评论 -
关键字参数
一, 使用方法参数前加**关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。def person(name, age, **kw): print('name:', name, 'age:', age, 'other:', kw)调用方式有两种,第一种:>>> person('Adam', 45, gende...原创 2018-09-21 16:06:52 · 1442 阅读 · 0 评论