- 博客(16)
- 资源 (1)
- 收藏
- 关注
原创 pandas groupby apply keyerror
这是由于np.errstate(all=“ignore”)的参数设成了ignore,在ide中不会有提示,继续运行后面的代码,apply函数会再试一次,.apply充当filter操作,此时会排除分组使用的key列,也就是再次尝试计算时,传递给自定义函数的dataframe不包含[‘station_id’,‘dev_id’,‘tag_date’]三列,导致自定义函数使用’station_id’的时候,找不到列名。4.重算时由于找不到columns,导致最终显示出来的报错。
2024-01-25 18:49:22 505 3
原创 matplotlib 使用心得(持续更新)
handles返回了三个2D曲线的handle,曲线内容为空,通过这三条曲线,生成颜色说明的图例。需求:在一个ax上,绘制多个图例,如一个图例对曲线进行说明,一个图例对颜色进行说明。ax.twinx()创建共享x轴的轴群,在上面代码后面增加以下代码即可。使用add_artist新增图例,否则会覆盖原图例。需求:不同数据的数值范围不同,需要两个坐标轴分别表示。legend功能很多,有兴趣可去官网查询一下。1.在折线上,对不同值的点使用不同颜色。2. 一个图上绘制多个图例。
2023-05-18 17:56:00 371
原创 通过pandas获得时间戳对象所在季度
季度按3-5(一季度)、6-8(二季度)、9-11(三季度)、12-2(四季度)这种不从1月开始划分时,视为将2月(‘Q-FEB’)作为当年最后一个月份。对series操作时,要使用dt方法,如。
2023-05-06 14:26:40 1074
原创 Python import matplotlib
python3.7在import matplotlib时出现了importError:DLL load failed,先是import ft2font 时出错,后来又出现matplotlib._path找不到。重装很多次matplotlib和numpy都没有用。搜了下,很多网友在import matplotlib.pyplot时报错。我的matplotlib版本是3.4.3,numpy是1.21.2。ft2font 这个问题,重装matplotlib就可以了。matplotlib._path和m
2021-09-14 10:43:07 1188
原创 机器学习(周志华) 习题 参考答案 第十六章
周志华老师的《机器学习》的第16章的习题答案较少,网上的参考答案链接分别为答案一和答案二。以下是个人对这章的习题的理解,如有问题,欢迎指正。16.1用于K-摇臂赌博机的UCB(Upper Confidence Bound)方法每次选择Q(k)+UC(k)最大的摇臂,其中Q(k)为摇臂k当前的平均奖赏,UC(k)为置信区间。例如:,其中,n为已执行所有摇臂的总次数,nk为已执行摇臂k的次数。比较UCB方法与ϵ-贪心法和Softmax方法的异同。1.UCB选则值最大的摇臂,是100%选择,而不是以一定概率
2020-12-31 15:14:49 2580
原创 机器学习(周志华) 习题 参考答案 第十三章
周志华《机器学习》西瓜书第十三章的习题答案较少,只找到了三篇,分别为链接一和链接二,这两篇文章有几乎所有题目的个人解答。第三个人只对部分题目进行了解答,相关链接将放在题目下方。以下是个人对这章的习题的理解,如有问题,欢迎指正。其中第四题和第五题网上答案较多,不再重复。13.1试推导出式(13.5)~(13.8)。见链接三这个答案解答的已经非常好了。13.2试基于朴素贝叶斯模型推导出生成式半监督学习算法。链接三上述链接中的答案,在前面分析的都没有疑问,但是最后求解时,感觉没有体现EM算法的M步,只
2020-12-04 14:58:16 2804 1
原创 LDA(Latent Dirichlet Allocation)隐狄利克雷分布及Gibbs采样求解
前言:LDA模型最开始是从周志华老师的机器学习的第14章最后一小节了解到的,但是书上写的很简略,看完不是很懂,而且课后题还建议自己编程实现LDA,所以上网查了下资料,以下是综合各种网上的资料之后的个人理解,欢迎批评指正。最后一篇参考文献是pLSA的,写的很详细。是LDA是一种无监督的贝叶斯模型。也是一种主题模型,它可以将文档集中的每篇文档按照概率分布的形式给出。还是一种无监督学习,在训练时不需要手工标注的训练集,需要的是文档集和指定主题的个数。它是一种典型的词袋模型,它认为一篇文档是由一组词组成的集合,词
2020-11-23 22:39:52 1116
原创 周志华《机器学习》西瓜书-第十章-习题
周志华《机器学习》西瓜书第十章的习题答案较少,只找到了两篇,见文末链接,以下是个人对这章的习题的理解,如有问题,欢迎指正。其中第一题和第六题网上答案较多,不再重复。10.2关于err,err*不等式的证明这里|y|是类的数量。10.3“中心化”,常见的方法是将协方差矩阵转换为,其中H=。中心化,即,X为dxm维,,1为mx1维的全1列向量,,,其中,是dx1维的。所以有 。10.4由中心化后的样本矩阵X的奇异值分解代替,试讲述原因。等价:X的奇异值分解为,,而,,因
2020-08-27 00:34:56 8427 1
原创 个人对Pandas中agg、apply和transform函数的理解
学习《利用Python进行数据分析》一书,关于pandas的这三个函数,个人理解如下。
2020-07-06 00:40:23 2068 1
原创 机器学习(周志华)第三章习题3.10的理解
10.试推出多分类代价敏感学习(仅考虑基于类别的错误分类代价)使用“再缩放”能获得理论最优解的条件。个人理解,题目的重点是能否获得最优解,以及获得最优解的条件。能获得理论最优解的条件是其二阶导数>0。再缩放之后,二分类情况下,预测为正例的可能性从y变为。多分类情况下,y'变为,再带入估计函数。在对ω和b进行估计的时候,需要看y对估计函数的二阶导数的值是否有影响,若有影响,则需进一步分析y和分类代价的取值范围(即条件),若无影响,y和分类代价值可能会对求解过程有影响。同时,如书中
2020-06-19 16:57:30 400
原创 python3.7在centos下安装pygame
《python编程从入门到实践》一书的第二部分开始,需要安装pygame。我用的是centos7,里面有内置的python2,我自己装了python3.7。pip安装pip3,安装过程网上教程很多,但是一般安装的不完全,需要注意的是安装ssl库,可以参考这篇文章:https://www.cnblogs.com/minglee/p/9232673.html主要是重装python3,以及T...
2019-04-22 23:09:19 1641 2
原创 关于NX UG11.0在visual studio中不能创建模板的问题
按照在网上搜的,更改visual studio版本的方法,可以在vs里创建项目。VB和C#都可以顺利创建项目。C++却有问题,显示脚本错误,有几个函数未定义之类的,查看脚本文件,对比着VB修改脚本文件,给11.0打补丁,换了几个vs版本,都没有用,屏蔽语句虽然不再报错,但是也不能正确创建项目。最后的解决方法是,实测NX12.0与VS2012可以配置成功,严重怀疑NX11.0安装配置时有...
2019-03-07 12:06:57 1604
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人