Python和网页上的数据
ILuvLittleCookie
搞了这么多年,最后还是学医去了。自己现在也没什么自信了,不过虽然不能成为从小就憧憬的程序员,偶尔堆堆代码满足一下自己还是很开心的。
展开
-
东搞西搞——豆瓣API试用
用Python试用豆瓣读书API不得不吐槽豆瓣,明明已经取消了开发者的申请,把开发者页面的链接地址从主页移除,然而还留着旧的教程;不过实际情况好像是不再需要申请使用API,而可以直接无限制使用(只是连续请求了100+次,没有任何伪装,真诚不做作,不知道再往上有没有限制)。代码其实很简单,也就是从《Python网络数据采集》里抄下来,换了个API而已。原创 2016-09-13 19:21:16 · 488 阅读 · 0 评论 -
读Python获取网络数据的笔记(9月16日)
今天看了第五章的第一节,讲存储媒体文件;书上的例子说的是下载图片,如果是视频我该怎么办……原创 2016-09-16 19:31:21 · 386 阅读 · 0 评论 -
Eclipse suffering day:第一天写博客
今天整了一天的eclipse,话说这个ubuntu自带的3.8版eclipse简直就是渣渣:用着1.8的jre和3.5.2的Python,居然没有办法用PyDev建立Python项目。不知道有没有其他人干过这事儿疑惑不解的,劝一句,不要疑惑不解了,解决方法其实很简单:1、上Eclipse官网,下载最新版本的(我现在的最新版是4.6 neon这个版本)。2、把系统默认的Python从2.原创 2016-08-25 00:06:12 · 287 阅读 · 0 评论 -
【好久不用bs4,手都生了】复习一点点bs4的用法
主要是复习《Python网络数据采集》的基础章节,参考了imooc站老师的一些代码,用到漂亮汤了我竟然不会写了。最后的代码如下:from urllib.request import urlopen #需要urlopen打开链接,BeautifulSoup解析Htmlfrom bs4 import BeautifulSoupclass Spider(): def g原创 2016-08-25 21:46:18 · 917 阅读 · 0 评论 -
把Html页面转化为简单的Markdown文件
其一,代码内容用Python3.5.2可以运行,产生正常结果,详细内容看代码。 这个东西的缺点还是比较明显的: 1. 目前只适配了萌娘百科这种大段文字的网站,a标签和img标签还没写出来; 2. 对萌娘百科常见的del标签处理的很难看; 3. 对translate方法中的大片if-elif-else很不满,因为修改起来太麻烦了,又不可能对选择分支加装饰器一类的东西。暂时还想不到别的办法原创 2016-09-06 16:57:48 · 8379 阅读 · 0 评论