日常
蓝翔厨师长
AI量化算法工程师
展开
-
随机森林(Random Forest)
RF的流程示意图:结合图解释RFRF:是一种bagging方法,将Decision Tree结合Bagging方法,并结合随机的思想(两处随机-抽样和选特征)。首先用bootstrap方法生成N个训练集,针对每个训练集构建一颗决策树。在节点找特征时,不是使用使用特征,而是在特征中随机抽取一部分特征,在抽到的特征中找到最优解。...原创 2021-03-04 17:46:38 · 309 阅读 · 1 评论 -
L1和L2正则化区别
https://blog.csdn.net/weixin_39525097/article/details/111611233转载 2021-03-04 16:15:28 · 388 阅读 · 1 评论 -
最小二乘法
一元线性方程:估计的一元线性方程:最小二乘法最小二乘法的定义为:因变量的观测值yi与估计值y估计之间的离差平方和达到最小,表示为:上式达到最小对上式β1和β2分别求偏导,使其为0,得到如下两个等式:最后解方程组得到β1和β2的解:...原创 2021-03-04 15:04:59 · 1181 阅读 · 1 评论 -
表格连接pandas.merge
两个原始表格:df1 = pd.DataFrame({'id':[2001,2002,2003,2004],'name':['小红','小华','小黑','小和'],'math':[100,97,20,89]})df2 = pd.DataFrame({'id':[2001,2002,2005],'chinese':[98,96,60]})print(df1)print(df2)merge内连接:将两个表id相同的数据进行保留并合并。df3 = pd.merge(df1,df2,how='i原创 2020-12-31 16:44:06 · 186 阅读 · 0 评论