【抓取】
sunshine0625
只要每天不在原地,就好
展开
-
爬虫抓取
爬虫抓取的方式有两种: 1.简单 import urllib2 dir(urllib2) urllib2.urlopen(url) html=responce.read() 2.复杂 import urllib2 def make_opener(headers=None): cookie=cookielib.CookieJar() opener=原创 2016-07-26 20:04:39 · 336 阅读 · 0 评论 -
git入门
1.初始化版本: git init git remote add origin http://gitlab.baidu.com/i18n_crawl.git 2.添加密钥: cd ~/.ssh ls ssh-keygen cat .pub 3.git设置邮箱和密钥: git config --global user.name "yang" gi原创 2016-07-27 19:54:18 · 214 阅读 · 0 评论 -
awk基本操作
$0变量:它指的是整条记录。如 $ awk '{print $0}' test将输出test 文件中的所有记录。 变量NR :一个计数器,每处理完一条记录, NR的值就增加1 。如$ awk '{print NR,$0}' test将输出 test文件中所有记录,并在记录前显示记录号。eg:awk '{print NR,$0}' abc awk中的数组的下标可以是数字和字母,原创 2016-07-28 18:23:46 · 360 阅读 · 0 评论