自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 python缺失值

使用python时,对缺失值的标记主要有3种:np.nan,None,pd.NA(注意大小写)。

2024-10-31 16:11:07 512

原创 pandas groupby apply keyerror

这是由于np.errstate(all=“ignore”)的参数设成了ignore,在ide中不会有提示,继续运行后面的代码,apply函数会再试一次,.apply充当filter操作,此时会排除分组使用的key列,也就是再次尝试计算时,传递给自定义函数的dataframe不包含[‘station_id’,‘dev_id’,‘tag_date’]三列,导致自定义函数使用’station_id’的时候,找不到列名。4.重算时由于找不到columns,导致最终显示出来的报错。

2024-01-25 18:49:22 505 3

原创 jupyter lab使用

记录一下使用过程中遇到的问题以及解决方法,网上资料感觉说的不是很明白,还是截图好用。

2023-09-19 13:32:59 700

原创 matplotlib 使用心得(持续更新)

handles返回了三个2D曲线的handle,曲线内容为空,通过这三条曲线,生成颜色说明的图例。需求:在一个ax上,绘制多个图例,如一个图例对曲线进行说明,一个图例对颜色进行说明。ax.twinx()创建共享x轴的轴群,在上面代码后面增加以下代码即可。使用add_artist新增图例,否则会覆盖原图例。需求:不同数据的数值范围不同,需要两个坐标轴分别表示。legend功能很多,有兴趣可去官网查询一下。1.在折线上,对不同值的点使用不同颜色。2. 一个图上绘制多个图例。

2023-05-18 17:56:00 371

原创 通过pandas获得时间戳对象所在季度

季度按3-5(一季度)、6-8(二季度)、9-11(三季度)、12-2(四季度)这种不从1月开始划分时,视为将2月(‘Q-FEB’)作为当年最后一个月份。对series操作时,要使用dt方法,如。

2023-05-06 14:26:40 1074

原创 DBeaver 离线安装

dbeaver离线安装

2022-11-30 12:01:37 1963

原创 cent7 安装 notepadqq

cent7安装notepadqq的历史版本

2021-12-02 12:10:33 1630

原创 Python import matplotlib

python3.7在import matplotlib时出现了importError:DLL load failed,先是import ft2font 时出错,后来又出现matplotlib._path找不到。重装很多次matplotlib和numpy都没有用。搜了下,很多网友在import matplotlib.pyplot时报错。我的matplotlib版本是3.4.3,numpy是1.21.2。ft2font 这个问题,重装matplotlib就可以了。matplotlib._path和m

2021-09-14 10:43:07 1188

原创 机器学习(周志华) 习题 参考答案 第十六章

周志华老师的《机器学习》的第16章的习题答案较少,网上的参考答案链接分别为答案一和答案二。以下是个人对这章的习题的理解,如有问题,欢迎指正。16.1用于K-摇臂赌博机的UCB(Upper Confidence Bound)方法每次选择Q(k)+UC(k)最大的摇臂,其中Q(k)为摇臂k当前的平均奖赏,UC(k)为置信区间。例如:,其中,n为已执行所有摇臂的总次数,nk为已执行摇臂k的次数。比较UCB方法与ϵ-贪心法和Softmax方法的异同。1.UCB选则值最大的摇臂,是100%选择,而不是以一定概率

2020-12-31 15:14:49 2580

原创 机器学习(周志华) 习题 参考答案 第十三章

周志华《机器学习》西瓜书第十三章的习题答案较少,只找到了三篇,分别为链接一和链接二,这两篇文章有几乎所有题目的个人解答。第三个人只对部分题目进行了解答,相关链接将放在题目下方。以下是个人对这章的习题的理解,如有问题,欢迎指正。其中第四题和第五题网上答案较多,不再重复。13.1试推导出式(13.5)~(13.8)。见链接三这个答案解答的已经非常好了。13.2试基于朴素贝叶斯模型推导出生成式半监督学习算法。链接三上述链接中的答案,在前面分析的都没有疑问,但是最后求解时,感觉没有体现EM算法的M步,只

2020-12-04 14:58:16 2804 1

原创 LDA(Latent Dirichlet Allocation)隐狄利克雷分布及Gibbs采样求解

前言:LDA模型最开始是从周志华老师的机器学习的第14章最后一小节了解到的,但是书上写的很简略,看完不是很懂,而且课后题还建议自己编程实现LDA,所以上网查了下资料,以下是综合各种网上的资料之后的个人理解,欢迎批评指正。最后一篇参考文献是pLSA的,写的很详细。是LDA是一种无监督的贝叶斯模型。也是一种主题模型,它可以将文档集中的每篇文档按照概率分布的形式给出。还是一种无监督学习,在训练时不需要手工标注的训练集,需要的是文档集和指定主题的个数。它是一种典型的词袋模型,它认为一篇文档是由一组词组成的集合,词

2020-11-23 22:39:52 1116

原创 周志华《机器学习》西瓜书-第十章-习题

周志华《机器学习》西瓜书第十章的习题答案较少,只找到了两篇,见文末链接,以下是个人对这章的习题的理解,如有问题,欢迎指正。其中第一题和第六题网上答案较多,不再重复。10.2关于err,err*不等式的证明这里|y|是类的数量。10.3“中心化”,常见的方法是将协方差矩阵转换为,其中H=。中心化,即,X为dxm维,,1为mx1维的全1列向量,,,其中,是dx1维的。所以有 。10.4由中心化后的样本矩阵X的奇异值分解代替,试讲述原因。等价:X的奇异值分解为,,而,,因

2020-08-27 00:34:56 8427 1

原创 个人对Pandas中agg、apply和transform函数的理解

学习《利用Python进行数据分析》一书,关于pandas的这三个函数,个人理解如下。

2020-07-06 00:40:23 2068 1

原创 机器学习(周志华)第三章习题3.10的理解

10.试推出多分类代价敏感学习(仅考虑基于类别的错误分类代价)使用“再缩放”能获得理论最优解的条件。个人理解,题目的重点是能否获得最优解,以及获得最优解的条件。能获得理论最优解的条件是其二阶导数>0。再缩放之后,二分类情况下,预测为正例的可能性从y变为。多分类情况下,y'变为,再带入估计函数。在对ω和b进行估计的时候,需要看y对估计函数的二阶导数的值是否有影响,若有影响,则需进一步分析y和分类代价的取值范围(即条件),若无影响,y和分类代价值可能会对求解过程有影响。同时,如书中

2020-06-19 16:57:30 400

原创 python3.7在centos下安装pygame

《python编程从入门到实践》一书的第二部分开始,需要安装pygame。我用的是centos7,里面有内置的python2,我自己装了python3.7。pip安装pip3,安装过程网上教程很多,但是一般安装的不完全,需要注意的是安装ssl库,可以参考这篇文章:https://www.cnblogs.com/minglee/p/9232673.html主要是重装python3,以及T...

2019-04-22 23:09:19 1641 2

原创 关于NX UG11.0在visual studio中不能创建模板的问题

按照在网上搜的,更改visual studio版本的方法,可以在vs里创建项目。VB和C#都可以顺利创建项目。C++却有问题,显示脚本错误,有几个函数未定义之类的,查看脚本文件,对比着VB修改脚本文件,给11.0打补丁,换了几个vs版本,都没有用,屏蔽语句虽然不再报错,但是也不能正确创建项目。最后的解决方法是,实测NX12.0与VS2012可以配置成功,严重怀疑NX11.0安装配置时有...

2019-03-07 12:06:57 1604

UG二次开发与数据库应用基础与典型范例(光盘及书籍pdf)

UG二次开发与数据库应用基础与典型范例,书籍pdf加光盘内容。

2019-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除