自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(5)
  • 收藏
  • 关注

转载 抓取起点中文网小说

恩,写在最前面。肯定是不能抓取VIP章节的,因为这违法了,(其实是我不会) 今天朋友告诉我,他看小说的时候,因为成片成片的错别字,经常是看着看着就看不下去,问我有啥办法解决 我说,你去正版网站看不就没事了...... 他说,你不是会爬虫吗,你帮我爬下来...... 我说,就我这菜*水平,普通章节吧...... 以下是代码,不足之处还请各位大神们,予以指正! 万分感谢! ...

2017-08-25 17:24:00 406

转载 爬虫抓取表格中的数据

有时候因为某些需求需要爬取某个网页中某个表格里的数据,这时候如果这个页面只有这一个表格的时候,那么抓取就比较容易了,但是当这个页面中有大量的表格的时候,再使用之前的方法,就会发现虽然也能抓取到要的数据,但是还有一大堆冗余。 这时候,就可以使用下面这种方法 就以这个网页里的表格为例 #coding:utf-8 import re import urllib2 url...

2017-08-18 18:33:00 968

转载 Pymsql之简单的事务回滚

# coding:utf-8 import pymysql class TransferMoney(object): def __init__(self,conn): self.conn=conn def check_acct_available(self,acctid): cursor = self.conn....

2017-08-17 21:17:00 129

转载 numpy笔记

1.shape 返回的是一个包含数组维度的元组,它也可以用于调整数组大小 import numpy as np a=np.array([ [1,2,3,4,5,6,7], [8,9,10,11,12,13,14] ]) print a.shape # 返回的是数组的大小 print a.shape[0] # 返回的是数组的维度 print a.shape[1] # 返...

2017-08-17 21:13:00 67

转载 pandas笔记

Pandas的数据类型 Pandas基于两种数据类型: series 与 dataframe 。 Series 一个series是一个一维的数据类型,其中每一个元素都有一个标签。类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。 import numpy as np import pandas as pd s = pd.Series([1, 2, 5, np...

2017-08-17 18:45:00 97

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除