自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 LeetCode Learning Notes --- Array

LeetCode Learning Notes905. Sort Array by ParityApproach: In-place swap766. Toeplitz MatrixApproach1: Compare905. Sort Array by Parityhttps://leetcode.com/problems/sort-array-by-parity/Approach: In...

2019-02-19 17:53:18 182

原创 LeetCode Learning Notes --- HashTable

LeetCode Record463 Island Perimetermethod#1: Mathmethod#2: Iterationmethod#3: Another Iteration wayCode463 Island Perimetermethod#1: MathSince the adjacent edge cannot be counted into perimeter, an...

2019-02-14 09:46:21 170

原创 微信公众号爬虫

需要爬取某个公众号的阅读量、评论量和点赞量。不得不说微信的反爬挺让人头疼的。不过细心抓包还是能找到规律的。但是大规模爬公众号我目前还没想出来,仅仅针对某个公众号爬取。过程中遇到一个问题。我是用python爬取的,用的requests==2.19.5。但是请求的时候老是报错:HTTPSConnectionPool(host=‘mp.weixin.qq.com’, port=443): Max re...

2018-11-08 14:15:06 544

原创 新浪微博爬虫(一)

最近一个项目需要爬取微博用户的发微博数量、转发量、评论数、点赞数,并对评论做情感分析。这两天大概做出了一个雏形,在此把爬微博过程中遇到的问题记录一下,供自己学习和大家参考。一、模拟登陆抓包要耐心;读懂新浪账号密码加密算法request的使用二、PC 端vs. 移动端PC端:页面更复杂,但好像反爬比移动端要宽松点儿移动端:页面结构简单,适合新手三、爬取过程中遇到的坑编码、找到转发、...

2018-10-31 15:19:04 3154

原创 微博官微爬虫

最近需要爬取某地区的官方微博,针对它的评论做情感分析。但是发现一个问题,该微博账号(以下简称A)有80多万粉丝,但是日常评论只有10-30条,而且不管A发布什么,下面大部分都是溢美之言,还有重复的一字不差的夸赞。另外,A的粉丝不可见。很明显大部分都是水军的留言。所以并不打算从里面获得什么东西,暂且当练手爬虫和神经网络吧。又找了其他几个官微,发现同样有许多粉丝对外不可见,并且日常评论数和粉丝数严重...

2018-10-26 14:45:15 335

原创 python 变量作用域问题(经典坑)

偶尔看到python的一个经典坑:flist = [lambda :i for i in range(5)]for f in flist(): print(f())按照一般逻辑,结果应该是 0 1 2 3 4 但运行结果是44444查了一下,主要是变量作用域问题和函数执行的问题。 出现这种情况的主要原因是,循环在python中不形成作用域。也就是说...

2018-08-03 12:05:15 6535 6

翻译 MySQL Tricks1

逛stackoverflow的时候偶然看到一些MySQL查询的小技巧 来源: https://stackoverflow.com/questions/12475850/sql-query-return-data-from-multiple-tables/12508381#12508381 例一:CREATE TABLE MovieList( ID INT, Movi...

2018-08-03 10:10:23 121

原创 python __future__

之前用python3.5编写代码,现在要让程序在2.7中运行。结果debug了一个多钟头,发现在python3.5中,1/20==0.05, 而在python2.7中,1/20=0, 结果导致一个大的dataframe全为0值。 可以用1.0/x来解决,但是更方便的是在程序开头: import __future__ division另外,python3统一用unicode编码,python2中

2017-12-27 13:48:24 360

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除