自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 DataFrame分组后求聚合后所在的行的值

如题,假设我有一个dataFrame,如图所示 a b c d e0 1 2 2 1 21 2 0 2 1 12 0 1 1 2 03 1 1 2 2 14 2 1 1 0 1我想按a列分组,求c值最大所在的行对应的d和e的值此时如果直接df.groupby('a').max(),求出结果为: b c d ea 0 1 1 2 01 2 2 2 22 1 2 1...

2018-11-22 14:24:41 865

原创 SVM人话理解

SVM 人话理解原理:找一个超平面,把数据分开,但是这样的超平面不唯一,我们要找一个最优的。什么样的最优?样本点距离平面的最小距离最大的最优。这个距离是函数间隔。函数间隔有个问题,可以同比例缩放,所以要把函数间隔变成几何间隔,几何间隔=函数间隔除以范数。设定函数间隔=1,所以最优问题变成了范数分之一的最大化。因为范数分之一的求导不好求,所以选用1/2范数的平方求最小,所以转成凸二次规划问题。这...

2018-11-19 17:59:15 160

原创 内容推荐:tfidf 给简历匹配相应的职位

1,爬简历import requestsimport lxmlfrom bs4 import BeautifulSoupimport pandas as pdurl='http://cv.qiaobutang.com/lp/53994d870cf2dda0896a66b1' #简历地址url_wangye=requests.get(url) #得到网页源码url_html=Be...

2018-11-02 19:00:53 654

原创 爬取历史类小说

导包import requestsimport lxml #lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高from bs4 import BeautifulSoupimport pandas as pdimport osheaders从网页获得,按F12, —>NETWORK---->刷新网页---->随...

2018-11-01 20:32:44 197

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除