数据分析
暮雨听轩
爱生活,爱笑,爱文字
展开
-
Jupyter notebook无法显示pyecharts
Jupyter无法显示pyecharts 图原创 2022-07-29 16:39:04 · 2152 阅读 · 0 评论 -
LGBM 模型保存为PMML 文件
LGBM 模型保存为PMML格式原创 2022-06-24 11:23:02 · 1089 阅读 · 0 评论 -
dataFrame 转成 字典dict
import numpy as npimport pandas as pddf = pd.DataFrame(data=np.arange(20).reshape(10,2), columns=['a', 'b',])df.to_dict() 结果默认 index 是 key ,其他字段是和 index 对应的 value所以,如果想要生成 a 是key ,b 是vaule 的 dict 则需要指定dateframe 的 index 是a ,代码如下:df.set_in..原创 2021-11-02 19:12:48 · 4297 阅读 · 0 评论 -
Linux 环境下 jupyter 转html
import subprocessgenerate = subprocess.run( [ "jupyter", "nbconvert", '/home/diana/Documents/demo/model_report.ipynb', "--to=html", "--template=report" ] )---'/home/dian...原创 2021-10-26 14:31:48 · 118 阅读 · 0 评论 -
window 环境下 jupyter 转html
1、用命令在,命令框输入一下命令,html 后面是要生成html 的ipynb 文件及路径jupyter nbconvert --to html e:\project\code\a01_demo.ipynb2、点击jupter 页面 file->Download as ->HTML但是这种都会带代码出来,没有找到只输出结果,不输出代码的方法...原创 2021-07-12 14:09:58 · 3365 阅读 · 0 评论 -
最小二乘法
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小使用最小二乘法拟和曲线高斯于1823年在误差e1,...en独立同分布的假定下,证明了最小二乘方法的一个最优性质: 在所有无偏的线性估计类中,最小二乘方法是其中方差最小的! 对于数据(,)(1=1,2,3,...m)拟合出函数 h(x),有误差,即残差=h(x) -此时 L2 范数(残差平方和)...原创 2021-06-23 16:21:30 · 111 阅读 · 0 评论 -
python sql 两时间相减,向下取整到天
import numpy as npimport pandas as pdimport datetime as dt(data['time1'] - data['time2']).dt.days, 两时间相减,时间相减不满一天向下取整select 等价 sql datediff('day',time2,time1)这种只用时间中的日期计算比如 time1 = 2020-10-25T11:43:04,time2 =2020-09-21T14:34:43datedif...原创 2021-02-23 17:24:46 · 722 阅读 · 0 评论 -
一行代码搞定数据探索性分析(EDA)
一行代码搞定数据探索性分析(EDA)查看名为 data 的 dataframe 里面字段分布情况,并输出为 df_profile.html大家可以准备一个 dataframe 运行一下这个代码看看,其中有data 的字段统计,哥字段分布、缺失值占比、平均值、最大值、最小值等等,下图有其中一个字段的输出结果import pandas as pdimport pandas_profilingpfr = pandas_profiling.ProfileReport(data)pfr....原创 2021-02-08 17:58:05 · 507 阅读 · 1 评论