python
Python小萝卜
这个作者很懒,什么都没留下…
展开
-
暖日暖夜高温日极端高温统计在python上的实现
暖日、暖夜、高温、极端高温统计。原创 2022-11-01 20:30:17 · 390 阅读 · 0 评论 -
python实现彭曼公式计算潜在蒸散发ET0
python实现彭曼公式计算潜在蒸散发原创 2022-08-24 12:56:21 · 5395 阅读 · 7 评论 -
修正降雨侵蚀力在python上的实现
计算公式数据结果代码原创 2022-05-29 16:20:04 · 392 阅读 · 0 评论 -
nc数据转tif在python上的实现
nc数据转成tif数据代码原创 2022-05-22 13:16:47 · 422 阅读 · 0 评论 -
python合并视频
安装包pip install moviepy -i https://pypi.tuna.tsinghua.edu.cn/simple视频数据python代码from moviepy.editor import VideoFileClip,concatenate_videoclipsimport os #参数设置data_path='./data'#分散视频路径suffix='.ts'#分散的视频后缀save_path="./合并结果.mp4"#合并后的视频名称..原创 2022-01-28 16:08:50 · 5870 阅读 · 3 评论 -
windows基于face_recognition实现人脸识别
环境搭建pip install opencv-python --user -i https://pypi.tuna.tsinghua.edu.cn/simplepip install opencv-contrib-python --user -i https://pypi.tuna.tsinghua.edu.cn/simplepip install cmake --user -i https://pypi.tuna.tsinghua.edu.cn/simplepip install boost -原创 2021-12-26 17:47:29 · 2193 阅读 · 0 评论 -
windows基于opecv-python实现人脸识别
环境搭建pip install opencv-python --user -i https://pypi.tuna.tsinghua.edu.cn/simplepip install opencv-contrib-python --user -i https://pypi.tuna.tsinghua.edu.cn/simple训练数据准备在data_train文件下放置训练数据,一个文件夹代表一个人的图片模型训练opencv读取训练数据,并用级联分类器检测人脸将人脸数据输入人.原创 2021-12-26 17:19:56 · 2117 阅读 · 0 评论 -
python实现车牌识别
原始图象代码from hyperlpr import HyperLPR_plate_recognitionimport cv2from PIL import ImageFont, ImageDraw, Imageimport numpy as npimage = cv2.imread("car.jpg")#读入图片result=HyperLPR_plate_recognition(image)#识别车牌plate = result[0][0...原创 2021-09-05 21:24:02 · 16016 阅读 · 8 评论 -
面板模型在python上的实现
背景 有一份城镇GDP相关的数据,共有9个地区分别11年(2008~2018)的数据,无缺失数据因而为9*11=99个样本。数据中包括X1(城乡居民年末储蓄存款), X2(年末常住人口), X3(城镇化率), X4(教育支出)共4个自变量,因变量为GDP。现希望研究4个自变量对于GDP的影响情况。以及数据值较大,为防止异方差问题因而进行过取对数处理。 理论 面板模型可继续分为三种类型,分别是FE模型,POOL模型(就是普通的OLS回归)和RE模型。最终应...原创 2021-07-28 22:26:06 · 4456 阅读 · 1 评论 -
python日期相减(秒、小时、天、月、年)
python代码import datetimetoday=datetime.datetime.now()datetime1=today-datetime.timedelta(seconds=10)#减10秒datetime2=today-datetime.timedelta(minutes=10)#减10分钟datetime3=today-datetime.timedelta(hours=1)#减1小时datetime4=today-datetime.timedelta(days=7)#减1原创 2020-12-07 16:35:48 · 16552 阅读 · 2 评论 -
pandas实现多行合并一行、一行拆分多行
多行合并一行import pandas as pd#构造数据data=pd.DataFrame({'id':[1,1,2,2],'品牌':['A','B','C','D']})#合并数据data_new=data.groupby(['id'])['品牌'].apply(list).to_frame()data_new['品牌']=data_new['品牌'].apply(lambda x:str(x).replace('[','').replace(']',''))合并前合并后原创 2020-07-03 15:04:39 · 18629 阅读 · 3 评论 -
python实现smote处理正负样本失衡问题
机器学习中难免遇到正负样本不平衡问题,处理办法通常有梁总,一:过采样,增加正样本数据;二:欠采样,减少负样本数据,缺点是会丢失一些重要信息。smote属于过采样。代码# from imblearn.over_sampling import BorderlineSMOTE# from imblearn.over_sampling import SMOTENC# from imblearn.over_sampling import SVMSMOTE# from imblearn.o...原创 2020-07-03 14:28:34 · 2800 阅读 · 2 评论 -
python pandas实现partition by组内排序功能
import pandas as pdimport numpy as npdic={'科目':['语文','语文','语文','语文','数学','数学','数学','数学','英语','英语','英语','英语'], '姓名':['赵大','钱二','孙三','李四','周五','郑六','王七','朱八','小红','小明','小李','小王'], '分数':[95,84,93,88,91,93,84,85,94,93,83,87]}data=pd.DataF.原创 2020-06-24 11:47:31 · 3479 阅读 · 0 评论 -
python3自动发送邮件并添加附件
思路从数据库读取报表数据 将报表数据以excel形式存到本地 将本地报表文件以附件形式添加到邮件发送 设置定时任务代码import pymysqlimport pandas as pdimport smtplibfrom email.header import Headerfrom email.mime.text import MIMETextfrom email.m...原创 2019-09-25 00:52:11 · 10267 阅读 · 15 评论 -
python:性能检测模块 line_profiler
line_profiler不仅能测试整个函数的运行时间,还能测试函数里每行代码的调用次数、耗时、以及耗时百分比。anaconda没自带line_profiler,需要安装。安装pip install line_profiler测试代码from line_profiler import LineProfilerdef jc(n): '阶乘' s=1 ...原创 2019-08-26 10:42:33 · 1073 阅读 · 0 评论 -
pyspark:k均值
from pyspark import SparkConffrom pyspark.sql import SparkSessionfrom pyspark.ml.linalg import Vectorsfrom pyspark.ml.clustering import KMeansimport pandas as pdif __name__ == "__main__": a...原创 2019-06-04 14:48:24 · 860 阅读 · 0 评论 -
pyspark:GBDT
from pyspark import SparkConffrom pyspark.sql import SparkSessionfrom pyspark.ml.linalg import Vectorsfrom pyspark.ml.feature import StringIndexerfrom pyspark.ml.classification import GBTClassifi...原创 2019-06-04 13:46:48 · 3062 阅读 · 0 评论 -
pyspark:随机森林
废话不多说,直接上代码:from pyspark import SparkConffrom pyspark.sql import SparkSessionfrom pyspark.ml.linalg import Vectorsfrom pyspark.ml.feature import StringIndexerfrom pyspark.ml.classification impo...原创 2019-06-04 11:47:08 · 4388 阅读 · 1 评论 -
pyspark:FPgrowth
原理https://blog.csdn.net/sunbow0/article/details/45602415https://www.cnblogs.com/haozhengfei/p/c9f211ee76528cffc4b6d741a55ac243.html代码from pyspark import SparkConffrom pyspark.sql import Spar...原创 2019-06-03 11:02:08 · 4210 阅读 · 12 评论 -
python-pandas总结
1 字段转seriesimport pandas as pdseries=pd.Series({'a':1,'b':2,'c':3})这样用字典方式构建了Series数据类型,为了将索引‘abc’提取出来并形成三维的列表,采用这种方式:ix=list(series.index)index方法获得index对象,可以直接用list函数转换为列表print(ix)可以获得结果:['...原创 2018-12-26 12:52:31 · 359 阅读 · 0 评论 -
python-fbprophet总结
时间序列预测一直是预测问题中的难点,人们很难找到一个适用场景丰富的通用模型,这是因为现实中每个预测问题的背景知识,例如数据的产生过程,往往是不同的,即使是同一类问题,影响这些预测值的因素与程度也往往不同,再加上预测问题往往需要大量专业的统计知识,这又给分析人员带来了难度,这些都使得时间序列预测问题变得尤其复杂。传统的时间序列预测方法通常有如下缺陷: 适用的时序数据过于局限...原创 2018-08-22 20:01:08 · 40567 阅读 · 11 评论 -
python特征选择
回归问题特征选择波士顿房价数据from sklearn.datasets import load_boston from sklearn.ensemble import RandomForestRegressor #Load boston housing dataset as an example boston = load_boston() X = boston["d...原创 2019-04-26 15:52:40 · 1878 阅读 · 0 评论 -
python定时发微信消息给心爱的她
由于工作繁忙有时会忘记关心下她,利用python给自己心爱的人每天定时发送微信消息也不失为一种维护感情的好方式,既可以学以致用,又能博得心爱的人开心何乐而不为!import requestsimport itchatfrom threading import Timer#获取金山词霸每日一句,英文和翻译def get_news(): url="http://open.ici...原创 2018-07-26 14:13:58 · 6935 阅读 · 3 评论 -
python连接、操作mongodb数据库
数据库连接from pymongo import MongoClientimport pandas as pd#建立MongoDB数据库连接client = MongoClient('162.23.167.36',27101)#或MongoClient("mongodb://162.23.167.36:27101/")#连接所需数据库,testDatabase为数据库名:db=...原创 2018-07-18 14:56:45 · 844 阅读 · 0 评论 -
关联规则算法(Apriori/Fp-growth)在Python上的实现
定义 关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。可从数据库中关联分析出形如“由于某些事件的发生而引起另外一些事件的发生”之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。又如“‘C语言’课程优秀的同学,在学习‘数...原创 2018-06-27 10:36:49 · 15742 阅读 · 5 评论 -
python连接sftp下载文件
python代码import paramiko import oshost="39.118.162.53" #sftp ipport=22 #sftp端口username="test" ...原创 2018-06-14 00:14:03 · 5904 阅读 · 1 评论 -
pymysql 连接mysql(带参数变量)
案例查询3班女生的分数Python代码import pymysql gender="女"#性别class_no=3#班级编号db = pymysql.connect(host="localhost",user="root",password="123456",db="test",port=3306,use_unicode=True, charset="utf8")#打开原创 2018-06-13 18:12:42 · 7420 阅读 · 2 评论 -
随机森林在python上的实现
默认参数class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=’auto’, max_...原创 2018-09-30 16:14:05 · 2403 阅读 · 0 评论 -
pyspark:导入第三方包
集群上的python环境通常没有任务计算所需要的包,pyspark中的SparkContext提供pyFiles参数供我们导入第三包,这里的包可以是我们自己写的py文件,也可以是.whl文件,比如测试中的并行计算需要用到以下三个包: 将三个包直接打包压缩成package.zip,记住一定要是zip格式测试代码from pyspark import...原创 2019-05-23 14:43:47 · 10496 阅读 · 0 评论 -
pyspark:连接spark集群Windows环境搭建
软件1、anaconda(python3.6)2、spark-2.4.3-bin-hadoop2.7(spark版本要和集群上的一样)3、JDK1.8python环境配置pip install pyspark这里如果遇到安装超时的情况采用以下命令pip --default-timeout=100 installpyspark或pip --default-ti...原创 2019-05-23 13:52:38 · 8394 阅读 · 4 评论 -
python缺失值填充
1. 用固定值填充对于特征值缺失的一种常见的方法就是可以用固定值来填充。data['分数'] = data['分数'].fillna('-1')2. 用均值填充对于数值型的特征,其缺失值也可以用未缺失数据的均值填充。data['分数'] = data['分数'].fillna(data['分数'].mean()))3. 用众数填充与均值类似,可以用未缺失数据的众数来...原创 2019-04-26 15:50:12 · 17174 阅读 · 1 评论 -
协同过滤推荐算法在python上的实现
1.引言 信息大爆炸时代来临,用户在面对大量的信息时无法从中迅速获得对自己真正有用的信息。传统的搜索系统需要用户提供明确需求,从用户提供的需求信息出发,继而给用户展现信息,无法针对不同用户的兴趣爱好提供相应的信息反馈服务。推荐系统相比于搜索系统,不需要提供明确需求,便可以为每个用户实现个性化推荐结果,让每个用户更便捷地获取信息。它是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣...原创 2019-03-09 15:24:06 · 16539 阅读 · 36 评论 -
python sorted对列表和字典排序
sorted函数参数:sorted(data, key=None, reverse=False) 其中,data是待排序数据,可以是List或者iterator, cmp和key都是函数,这两个函数作用于data的元素上产生一个结果,sorted方法根据这个结果来排序。 key 是带一个参数的函数, 用来为每个元素提取比较值. 默认为 None, 即直接比...原创 2019-02-15 16:04:58 · 1271 阅读 · 0 评论 -
python-openpyxl总结
1 创建文件from openpyxl import Workbook # 实例化wb = Workbook()# 激活 worksheetws = wb.active2 打开已有文件from openpyxl import load_workbookwb2 = load_workbook('文件名称.xlsx')3 存储数据# 方式一:数据可以直接分配到...原创 2018-12-26 10:37:10 · 934 阅读 · 0 评论 -
python通过flask框架接收网页请求并返回结果
python端from flask import Flask,request,jsonifyapp = Flask(__name__)#创建一个服务,赋值给APP@app.route('/get_sum',methods=['post'])#指定接口访问的路径,支持什么请求方式get,postdef get_sum(): a= request.form.get('a') ...原创 2019-06-04 14:42:32 · 9044 阅读 · 0 评论