编程
喜东东cc
分享为主
展开
-
【Python】有序回归相关包
1、mord包mord.LogisticITmord.LogisticATmord.OrdinalRidgemord.LADmord.MulticlassLogistic原创 2021-03-30 14:17:06 · 1420 阅读 · 0 评论 -
【Python】使用CGI编写简单Web表单
一、问题折腾了大半天,终于搞定。被网上各种模模糊糊Apache关于CGI 配置弄得心力交瘁。最终是通过python 3 中http.server搞定本地服务器。二、方案1.脚本前端网页friends.html<HTML> <HEAD> <TITLE>Friends CGI Demo (static scr...转载 2020-03-15 15:07:16 · 581 阅读 · 0 评论 -
【Python】使用pip命令为PyCharm安装第三方包
一、问题1.背景:Win10,先安装Anaconda后,再装的PyCharm(使用anaconda的python.exe)。2.问题:使用常规方法为PyCharm安装第三方包时(File>Settings>Project: pyPrograms>Project Interpreter),经常有些包找不到 或 安装失败。二、解决1.说明:在终端中使用pip命令...原创 2020-03-11 17:12:53 · 1925 阅读 · 0 评论 -
【JAVA】eclipse快捷键
创建class:Shift+Alt+n 复制一行:Ctrl+Alt+Down 、Ctrl+Alt+Up 注释:Ctrl+/ 、 Ctrl+Shift+/ 反注释:Ctrl+/ 、 Ctrl+Shift+\ 删除一行:Ctrl+d转载 2018-08-06 11:24:12 · 143 阅读 · 0 评论 -
【Python】将statsmodels库训练好的模型OLS保存本地
【参考】1.https://ask.helplib.com/python/post_128509272.https://blog.csdn.net/qq_33363973/article/details/77881168【代码】1.因为文件的类型是字节bytes型的, 所以写入的模式必须是'wb',读取是'rb'。import statsmodels.api as sm...原创 2019-07-30 15:19:51 · 2714 阅读 · 1 评论 -
【python】常用参数设置
(以免老是忘记,重复去搜索)1.Pandas 打印时,显示的行数/列数import pandas as pdpd.set_option('display.max_columns', 500) # 最多打印500列,若为None,则为不限制pd.set_option('display.max_rows', 500) # 最多打印500行,若为None,则为不限制2.不以...转载 2019-07-03 13:44:06 · 480 阅读 · 0 评论 -
【python】计算动态时点的百分位数
【说明】1.动态时点:每次计算的数据框为截止于当前行的数据,即累计行(多次计算);2.静态时点(当前时间):计算的数据框为所有行(一次计算);【代码】test = pd.DataFrame(np.random.randint(1, 10, size=10), columns=['value']) # 生成[1,10]的随机整数test['pct_sf'] = test....原创 2019-07-02 17:00:56 · 1366 阅读 · 0 评论 -
【Python】DataFrame获取列名
【参考】1.从pandas DataFrame列标题中获取列表假定有数据集df,格式为dataframe,现想获取其列名,列举以下几种方法:1. df.columns返回的是array格式。2. list(df)返回list格式。(最近获知,非常方便,原理待探究)3. df.keys()...转载 2019-06-26 13:34:51 · 72443 阅读 · 1 评论 -
【Python】将DataFrame.info()存储为变量
【参考】1.How to return a string from pandas.DataFrame.info()2.pandas.DataFrame.info3.Python文件读写、StringIO和BytesIO【补充】1. 简介日常工作中,通常使用它来查看数据的基本统计信息(如索引、列数、列名、数据量、数据类型、缺失值、内存等),其语法结构如下:D...转载 2019-05-10 14:19:13 · 9073 阅读 · 0 评论 -
【Python】逐步回归
【参考】1.https://datascience.stackexchange.com/questions/937/does-scikit-learn-have-forward-selection-stepwise-regression-algorithm2.特征工程(一):前向逐步回归(R语言):https://zhuanlan.zhihu.com/p/316145643.模型...原创 2019-05-30 09:48:06 · 10589 阅读 · 2 评论 -
【Python】matplotlib(散点图)添加趋势线
【参考】1.如何在python matplotlib点(散点图)中添加趋势线?2.np.polyfit()与np.poly1d()将点拟合成曲线【补充】import matplotlib as mplimport matplotlib.pyplot as pltdef plot_trendline(x, y, n): mpl.pylab.plot(x, y...转载 2019-04-26 15:20:59 · 28803 阅读 · 0 评论 -
【Python】绘制R中线性回归诊断图
【参考】1. 如何在Python绘制与R一样的线性回归诊断图?2.6 ways to run a "simple" regression(使用6种工具)(1)原文:https://underthecurve.github.io/jekyll/update/2016/07/01/one-regression-six-ways.html#Python(2)脚本:https://gi...转载 2019-04-26 14:42:13 · 3000 阅读 · 0 评论 -
【Python】matplotlib配置图表默认项(rcParams 和 style)
【参考】1. matplotlib教程之——自定义配置文件和绘图风格(rcParams和style)2.matplotlib官方文档【补充】import matplotlib as mplmpl.rcParams['axes.color_cycle'] = ['r', 'g', 'b', 'c']# 系列颜色mpl.rcParams['axes.linewidth'...转载 2019-04-26 10:26:00 · 1607 阅读 · 0 评论 -
【Python】计算XIRR
一、概述XIRR是Microsoft Excel中的一个财务公式,主要计算一组不定期发生的现金流的内部收益率(年化收益率)。(具体语法)二、在Python中计算XIRR方法一:(原文)import datetimefrom scipy import optimize# 函数def xnpv(rate, cashflows): return sum([cf/(...原创 2019-04-09 14:32:48 · 8402 阅读 · 2 评论 -
【Python】数据截断np.clip() 与 Series.clip()
# numpy# 将数组a的取值范围限制为[a_min, a_max],其中a_min, a_max的取值为人为定义。numpy.clip(a, a_min, a_max, out=None)# pandasSeries.clip(lower=None, upper=None, axis=None, inplace=False)...原创 2019-03-05 10:25:14 · 6770 阅读 · 0 评论 -
【Python】groupby 和 agg 实现string聚合(collect_set)
一、目的: 通过Pandas中的groupby和agg结合自定义函数,实现针对string型数据的聚合函数,即同一组别的唯一值,以数组形式返回(类似Hive中的collect_set函数) 二、实现方法一:1.groupby返回的是一个迭代器(key, keyvalue),需要For循环提取;2.agg中每次传入的是一个key的所有keyvalue数据(若前面g...原创 2018-11-22 17:34:57 · 7144 阅读 · 0 评论 -
【Python】pandas实现row_number() over()函数
原文:https://blog.csdn.net/qq_22238533/article/details/72395564'''dataset: DataFrame格式数据集partionby:分组依据字段orderby:排序依据字段asc:是否为升序;1:升序;0:降序return series格式:序号'''def row_number(dataset, partion...转载 2018-10-26 13:36:30 · 13451 阅读 · 0 评论 -
【Python】Json解析各种问题
1.数据不规则,需提取{}内的内容result = json.loads(re.findall(r"{'.+?'}", str(test)))2.json字符串中的非法双引号转自:https://blog.csdn.net/weixin_39198406/article/details/81709397def deal_json_invaild(data): data ...转载 2018-10-19 17:51:13 · 1321 阅读 · 0 评论 -
【Python】linux下添加Python环境变量
永久性添加:https://blog.csdn.net/idKevin/article/details/78524226转载 2018-10-09 10:02:07 · 10963 阅读 · 1 评论 -
【python】等频分箱qcut
在python 较新的版本中,pandas.qcut()这个函数中是有duplicates这个参数的,它能解决在等频分箱中遇到的重复值过多引起报错的问题;在比较旧版本的python中,提供一下解决办法:import pandas as pddef pct_rank_qcut(series, n): ''' series:要分箱的列 n:箱子数 '''...原创 2018-09-11 16:32:42 · 19133 阅读 · 0 评论 -
【Python】zip() & zip(*)
zip(): 将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。< python2返回列表,python3返回对象>利用 * 号操作符,可以将 元组解压为列表。In[1]: a = [2, 2, 2]In[2]: b = [1, 1, 1]In[3]: print( list( zip(a, b) ) ) #打包Out[3]: [...转载 2018-06-14 18:00:14 · 451 阅读 · 1 评论 -
【Python】安装第三方包(setup.py)
在github上下载了records文件到本地。解压文件cmd切换到文件setup.py的目录下先执行 python setup.py build再执行python setup.py install 如果在执行step3时,遇到如下报错: python不是内部命令或外部命令,也不是可执行程序!找到python安装路径我的电脑(计算机) > 属性 >...原创 2018-05-31 14:25:03 · 14134 阅读 · 0 评论 -
【Python】from . import XXX
一. 官方文档 sound/ Top-level package __init__.py Initialize the sound package formats/ Subpackage for file format conversions ...原创 2018-05-31 10:34:59 · 14229 阅读 · 2 评论 -
【Shell】在windows下编辑shell脚本
注意事项: 1、第一行:#!/bin/bash 2、Notepad++编辑器:将文档格式转换为unix原创 2018-07-13 14:45:41 · 14221 阅读 · 0 评论 -
【Shell】
1、$0、$n(eg.$1)、$#、 $*、$@、$?、$$和命令行参数的含义$0 #shell脚本本身的名字;$n(eg.$1) #shell脚本传的第n个参数;$# #传递给脚本或函数的参数个数;$* #传递给脚本或函数的所有参数; $@ ...转载 2018-05-11 17:57:08 · 118 阅读 · 0 评论