- 博客(5)
- 收藏
- 关注
转载 抓取起点中文网小说
恩,写在最前面。肯定是不能抓取VIP章节的,因为这违法了,(其实是我不会) 今天朋友告诉我,他看小说的时候,因为成片成片的错别字,经常是看着看着就看不下去,问我有啥办法解决 我说,你去正版网站看不就没事了...... 他说,你不是会爬虫吗,你帮我爬下来...... 我说,就我这菜*水平,普通章节吧...... 以下是代码,不足之处还请各位大神们,予以指正! 万分感谢! ...
2017-08-25 17:24:00 452
转载 爬虫抓取表格中的数据
有时候因为某些需求需要爬取某个网页中某个表格里的数据,这时候如果这个页面只有这一个表格的时候,那么抓取就比较容易了,但是当这个页面中有大量的表格的时候,再使用之前的方法,就会发现虽然也能抓取到要的数据,但是还有一大堆冗余。 这时候,就可以使用下面这种方法 就以这个网页里的表格为例 #coding:utf-8 import re import urllib2 url...
2017-08-18 18:33:00 990
转载 Pymsql之简单的事务回滚
# coding:utf-8 import pymysql class TransferMoney(object): def __init__(self,conn): self.conn=conn def check_acct_available(self,acctid): cursor = self.conn....
2017-08-17 21:17:00 145
转载 numpy笔记
1.shape 返回的是一个包含数组维度的元组,它也可以用于调整数组大小 import numpy as np a=np.array([ [1,2,3,4,5,6,7], [8,9,10,11,12,13,14] ]) print a.shape # 返回的是数组的大小 print a.shape[0] # 返回的是数组的维度 print a.shape[1] # 返...
2017-08-17 21:13:00 82
转载 pandas笔记
Pandas的数据类型 Pandas基于两种数据类型: series 与 dataframe 。 Series 一个series是一个一维的数据类型,其中每一个元素都有一个标签。类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。 import numpy as np import pandas as pd s = pd.Series([1, 2, 5, np...
2017-08-17 18:45:00 112
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人