Python
ipomonkey
只是小小程序猿
展开
-
Python爬虫入门——百度百科词条数据
1.爬虫的简介和价值爬虫: 一段自动抓取互联网信息的程序 价值:互联网数据,为我所用 可以应用到:新闻聚合阅读器、最爆笑的故事APP、最漂亮美女图片网、图书价格对比网、Python技术文章大全等等。2.URL管理器URL管理器:管理待抓取URL集合和已抓取URL集合实现方式内存 Python内存 待爬取URL集合:set() 已爬取URL集合:set() ...原创 2018-09-20 10:29:09 · 1132 阅读 · 0 评论 -
修改GitHub语言设定
今天上传了一个python爬虫的项目,但是由于其中导出文件有output.html,结果被github 识别为html项目。那如何修改github上的语言设定呢?在你要上传的项目下新建一个.gitattributes文件。请使用命令行创建,window下不允许右键以点开头的文件> type NUL > .gitattributes打开这个文件,在其中写入:*.h...原创 2018-09-20 10:35:39 · 496 阅读 · 0 评论