python
去捕鱼
这个作者很懒,什么都没留下…
展开
-
爬取历史类小说
导包import requestsimport lxml #lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高from bs4 import BeautifulSoupimport pandas as pdimport osheaders从网页获得,按F12, —>NETWORK---->刷新网页---->随...原创 2018-11-01 20:32:44 · 172 阅读 · 0 评论 -
内容推荐:tfidf 给简历匹配相应的职位
1,爬简历import requestsimport lxmlfrom bs4 import BeautifulSoupimport pandas as pdurl='http://cv.qiaobutang.com/lp/53994d870cf2dda0896a66b1' #简历地址url_wangye=requests.get(url) #得到网页源码url_html=Be...原创 2018-11-02 19:00:53 · 633 阅读 · 0 评论 -
DataFrame分组后求聚合后所在的行的值
如题,假设我有一个dataFrame,如图所示 a b c d e0 1 2 2 1 21 2 0 2 1 12 0 1 1 2 03 1 1 2 2 14 2 1 1 0 1我想按a列分组,求c值最大所在的行对应的d和e的值此时如果直接df.groupby('a').max(),求出结果为: b c d ea 0 1 1 2 01 2 2 2 22 1 2 1...原创 2018-11-22 14:24:41 · 858 阅读 · 0 评论