自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 问答 (1)
  • 收藏
  • 关注

原创 新更一版随笔

不过是因为用了新电脑,碰巧现在有了麒麟系统,碰巧又安装了pycharm,Python3.8和对这一切充满好奇的我,要开始新的篇章了,这只是个开始,也没准是结束。

2024-05-23 14:22:59 81

原创 http的8种请求方式

言佳节虽过,近日却无心于学,真乃大罪。糊涂三日,半梦半醒,虽正值当年,却忘青云之志,实在可悲可笑。为燕雀,虽不知鸿鹄之志,却亦不止蓬蒿之间,望时刻警之  最近有在学习request的相关内容,然而在仔细学习崔庆才博客的时候,发现了一道名为实力的鸿沟,很多与http协议有关的内容了解太少,便去网上查了一些,也总结了一些。参考网址:http://blog.csdn.net/ahaaaaa/arti

2017-10-12 20:17:37 29523 1

原创 Windows下kettle安装及建立与资源库连接

额。。。额。。额,曲项。。呸呸,大概与上次更博隔了有大半个世纪了吧,我都觉得不会再写博客了(怎么可能)。日常牢骚结束,开始进入正文(我都不信)  好吧,进入正题,本熊最近接触了有关kettle的一些内容,关于kettle,中文水壶,一种数据抽取的工具我也还不是很理解,大概百度一下你就知道了(就这种博客纯属坑人啊)  再次进入正题(总也没发博客,废话太多)kettle的压缩包是可以在官网上下

2017-09-12 19:48:44 2097

原创 pandas numpy学习笔记

Np.zeros(10, dtype = int)强制将float型转为int型Np.linspance () 与np.arange()类似但是产生多的是起始值与终止值之间的数据Numpy 便利的创建二维数组, reshape()重组一个意味数组分为两个维度Eg: m=np.arange(0,20).reshape(5,4)Out :   确定二维数组行数  np.

2017-04-17 21:06:34 2115

原创 一头熊的陈述(纯属个人娱乐就当发空间吧)

这,大概是本熊第一次发心情日志吧,没有任何技术性,算是牢骚也算是感慨。  学习Python有大半年了吧,开始准备向其他更专的地方走,于是开始了数据挖掘,于是开始接触机器学习,于是开始照书打了人生,哦,不,是熊生中第一个算法,knn算法,发现好复杂,比我之前写的任何一个简单的爬虫都要复杂的多,我甚至只是很机械的将代码打了一遍,大概知道每部分的意思,没有像原来那样对代码进行仿写什么的,没有做任何改

2017-03-30 22:05:35 545

原创 pip安装numpy、scipy模块失败解决办法

咳咳,新学期开始了,又会有新的问题出现、新的麻烦解决、新的方法学习以及新的问题出现、新的方法学习、新的问题解决,周而复始(某熊的神经大概是出现了问题),好吧,我是被模块给折磨的有些不正常了,经历了辣么长的一个晚上,终于找到了解决办法   新人小白熊最近在看有关机器学习的东西,然而一开始就给了一个下马威,在安装numpy模块时,发现一直以各种姿态安装失败,如这种 (安装文件名错误)

2017-03-10 16:14:39 10207 1

原创 二级随笔第三弹

While循环语句,先计算括号内的值,若不为0,则执行循环语句,若为0,则跳出循环,所以表达式总是比循环体多执行一次 Switch 语句中可以有default,也可以没有,最多只能有一个:break用于跳出当前的switch语句,可以根据需要添加相应的break,所以可以使用break也可以不使用 数组的下限永远为0; 在逻辑上可以把二维数组看成是一个具有行和列的表格或矩阵

2017-03-07 17:29:54 466

原创 二级随笔第二弹

刚刚在准备发随笔的时候想到笔记可能很多,觉得可能分开会比较好。后期的程序题应该不会太占地方吧(还没有做那部分)所以等到程序题再都放到一起,不经常发新的有关内容结构化程序设计思想:自顶而下、逐步求精、模块化、限制使用GOTO语句 对象的基本特征:标示唯一性、分类型、多态性、封装性、模块独立性 继承:指能够直接获得已有的性质和特征而不必重复定义他们,所以说继承是类之间共享属性和

2017-03-01 18:50:48 413

原创 二级考试复习随笔

经过了辣么久的冬眠,本熊又回来了,新的学期,新的开始,不定期更新计算机二级考试复习随笔,希望能考的过去,不然怕是要翻水水了。。皮皮虾,我们走(警察叔叔,又捉到一个骑皮皮虾的)堆:最大堆是一棵每一个节点的键值都不小于或大于其孩子的键值的书。大堆顶是一棵完全二叉树,同时是一棵最大树。小堆顶是一棵完全二叉树同时也是一颗最小树 对于满二叉树,叶子节点的数目等于2(n-1),

2017-02-28 21:36:56 648

原创 爬虫第五战 scrapy小说爬取

终于发了起点小说爬取的姊妹篇,scrapy小说爬取,到现在这种方式还不是十分理解,但还是试了,也试出了一些成果,那么,现在进入正题Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。(好吧,这是我抄的)

2016-12-18 21:46:44 2967 1

原创 爬虫第四战爬取糗事百科搞笑段子

又开始了新的篇章,本熊继续一个Python小白的修行之路,这次要爬取糗事百科主页的段子,恩 。。看起来不错的样子,只是段子不能吃 ,不然,啧啧。。。相信很多人有去糗百看段子减压的习惯,如果能把这些段子爬下来,以后即便到了一个没网的地方  ,只要文本在手就不会冷场,还是好处多多的。3.2..1...开始爬虫之旅(今天说了两段废话,这习惯得改)今天的爬虫主要是为了复习下正则,所以相对还

2016-12-14 21:54:31 702

原创 爬虫第三战 json爬取网易新闻

出洞,写代码,本熊这次要带来的新内容是涉及到一部分动态网页的问题,爬取网易新闻,感觉这次难度不是一般的大,好吧,,其实我每次都是这么想的。我什么时候能写出非常棒的代码呢(图样图森破),转回正题,NOW如果按以前的老套路一定是上网址,放代码等等但这次这个套路似乎已经行不通了,当打开新闻评论所在的网址的源代码时,搞什么!!什么也没有,莫方莫方,不是我们的评论被黑掉了,只是我们的打开方式不正确,换个

2016-12-14 21:04:46 5152 1

原创 爬虫第二战,beautifulsoup小例

额。。这个标题着实难到我这个英文很烂的人了,毕竟在验证bs的时候有着四个单词写错俩的战绩,不过想要真的成为一只程序熊,阴雨(英语)很烂可是不行的。进入正题。   如果有在bs安装的时候遇见问题的小伙伴可以去看之前的博客,虽然很烂,,只希望能稍微帮上一丢丢。bs在某些方面是要优于正则的,比如它是通过标签对问题进行获取分析的,直观上看起来会比较简单,但,有些时候单靠bs是获取不到有些内容的佐以正则

2016-12-14 19:37:12 1067

原创 补发爬虫第一战,正则匹配

本来是要准备发小说爬取得姊妹篇——scrapy,不过鉴于本熊是很理解scrapy的各个部分,所以决定暂时将小说爬取后延,不好意思啦,那么接下来,Python爬虫第一战——正则爬取百度贴吧图片作为写的熊生中第一个爬虫,其实并没有留下什么美好的记忆,讲真,真的不是一段很友好的旅程正则表达式,一段很特殊的字符串,用来匹配字符串并对对应字符串进行处理。这里引用一个教程点击打开链接htt

2016-12-13 21:36:31 777

原创 爬取起点小说

倒霉催的熊博主又回来了,恩。。你没有看错,本熊并没有冬眠,而是在各种搞事搞事搞事(这样说话是会挨揍的)。。。我们的目标是搞事情!!!!进入正题,应用BS和正则爬取起点小说所有免费完本小说(听起来就好口怕)这一篇与接下来的一篇将会是姊妹篇,先剧透下,下一篇博文同样是爬取起点小说的所有免费完本小说,区别在方法不同,bs+re   VS  scrapy 。Begin   Fight!!!

2016-12-12 19:06:58 10743 3

原创 win10安装scrapy ,个人安装过程错误及结果

恩,经过一段时间的学习,新的章节已经开启,初次接触scrapy,原谅我还没弄明白他是什么。。。。无良博主又来刷新一波博客,熟悉了一段时间的bs和正则,准备接触新的部分 scrapy ,正如标题所说,无良的脑残博主又和当时安装bs的时候一样,直接安装scrapy,闲话不叙,进入正题首先感谢我的学姐小刀儿砸,我的安装过程就是由她的博客学来的:http://blog.csdn.net/tt_25

2016-11-30 19:08:01 2986

原创 爬 CSDN 1024程序员节论坛作者内容点赞量

好久没写博客了,还好本熊(不是熊本熊)不写小说,不然扔过来的砖都够盖小房子了。闲话少叙,进入正题今天刚刚爬了csdn论坛有关程序员节的内容,诺。。就他 http://blog.csdn.net/1024.html习惯性打开网页源代码,额,,,,果然,nothing 。一个动态加载的网页,或许是json加载的,,恩 ,没错fn+f12(在Dell机上有快捷键设置,只好用fn+的方法),翻

2016-11-16 20:52:34 1879 3

原创 beautifulsoup部分笔记(随时可能有更新)

beautifulsoup4使用从文档中获取为文字内容  soup.get_text()获取文档树  soup.tag名   取点只能获取第一个tag.contents将tag子节点以列表形式输出.child对tag的子节点进行循环.descendants对所有子孙节点进行递归循环如果tag中包含多个子串,用.strings进行循环   .str

2016-10-25 21:59:59 441

原创 有关Python中beautifulsoup安装遇到的问题

经过辣么长的时间终于在pycharm下可以调用bs了下面是遇到的问题以及一些解决办法

2016-10-17 21:47:40 5979

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除