codingforhaifeng的博客

Do what makes you great

UC头条(大鱼)文章评论内容抓取

下面以某一篇文章为例,分析UC头条(大鱼)文章评论内容抓取: 首先我们点击进入上面的这一篇文章,然后拉到评论内容区,通过抓包分析发现其评论接口为: https://m.uczzd.cn/iflow/api/v2/cmt/article/13191933289453545149/commen...

2019-03-28 17:34:57

阅读数 47

评论数 0

百度新闻评论内容抓取

通过抓包分析发现,百家号手机app端文章评论内容接口为:https://ext.baidu.com/api/comment/v1/comment/getlist?appid=101&sid=1008524_2-1010050_1-1007549_23033-1007550_2303...

2019-03-26 11:53:27

阅读数 124

评论数 2

今日头条文章评论内容爬取

因为业务要求,需要爬取今日头条文章相关评论内容。经过分析,今日头条评论接口有很多个(主要包括PC端和app端)。 经过分析发现app端较pc端更好爬取,主要是从大量爬取被封IP的概率考虑。下面主要以http://is-hl.snssdk.com/article/v4/tab_comments...

2019-03-25 18:29:40

阅读数 345

评论数 0

Python爬虫定时任务

方法一: time模块中的sleep()方法 Python time sleep() 函数推迟调用线程的运行,可通过参数secs指秒数,表示进程挂起的时间。 语法:time.sleep(t) 实例: 结果: 方法二:datetime模块中的timedelta()方法 实例:mi...

2019-01-07 16:33:16

阅读数 95

评论数 0

Python基本语法之:字符串和字典介绍

字符串(Strings) Python语言真正出色的地方之一是字符串的操作。本节将介绍Python的一些内置字符串方法和格式化操作。 1、字符串语法 使用单引号或双引号定义Python中的字符串。它们在功能上是等价的。 如果字符串里面有字符串,若字符串里面的字符串为单引号,则外面的字符...

2018-12-01 14:26:44

阅读数 50

评论数 0

numpy.random.rand()、numpy.random.randn()及numpy.random.randint()的区别

1、numpy.random.rand()     rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1    返回值为指定维度的array 2、numpy.random.randn()     randn函数返回一个或一组样本,具有标准正态分布。    标准正态分...

2018-11-13 14:11:38

阅读数 37

评论数 0

Matplotlib数据可视化画图

1. 基础绘图 2. 图表的基本元素 图名、x轴标签、y轴标签、图例、x轴边界、y轴边界、x刻度、y刻度、x刻度标签、y刻度标签 3. 图表样式 linestyle、color、marker、style (linestyle、marker、color)、alpha、colo...

2018-11-12 23:56:48

阅读数 33

评论数 0

Numpy基础:数组和矢量计算

参考链接https://www.jianshu.com/p/a380222a3292

2018-11-08 23:37:06

阅读数 22

评论数 0

Python数据分析之Pandas

Python中的pandas模块进行数据分析: 1、数据结构简介:DataFrame和Series 2、数据索引index 3、利用pandas查询数据 4、利用pandas的DataFrames进行统计分析 5、利用pandas实现SQL操作 6、利用pandas进行缺失值的处理 7、利用pa...

2018-11-05 21:06:33

阅读数 50

评论数 0

numpy中matrix*array、matrix*matrix和arrary*array的区别

1、matrix*array 表示的是矩阵乘 2、matrix*matrix 表示的是矩阵乘 3、arrary*array 表示的是对应的元素相乘

2018-10-11 09:59:31

阅读数 39

评论数 0

机器学习——决策树

决策树——https://blog.csdn.net/jiaoyangwm/article/details/79525237

2018-09-27 20:55:00

阅读数 40

评论数 0

Python isalpha()方法 以及 itertools.product()方法

 isalpha()方法: Python isalpha() 方法检测字符串是否只由字母组成。 isalpha()方法语法: str.isalpha() itertools.product()方法: https://www.cnblogs.com/anpengapple/p/50510...

2018-09-25 16:14:28

阅读数 61

评论数 0

python切片,反转字符串

”左开右毕,从右向左读“ 或者可以这样:先切片再反转  

2018-09-04 15:29:00

阅读数 70

评论数 0

python map()函数和lambda表达式

python map(fun,[arg]+)函数最少有两个参数,第一参数为一个函数名,第二个参数是对应的这个函数的参数(一般为一个或多个list)。 >>>def fun(x): ... return x+1 ... &...

2018-09-03 18:16:47

阅读数 32

评论数 0

Python 集合set

可变集合set 集合set是Python中一种基本数据类型,它分为可变集合(set)和不可变集合(frozenset)两种。类似于其他语言,集合是一个无序不重复元素集,包括创建集合set、向集合中添加元素、删除集合中的元素、求集合的交集、并集、差集等操作。下面就让我们一一来学习集合的这些知识吧。...

2018-08-29 19:50:26

阅读数 83

评论数 0

python enumerate用法总结

转自https://blog.csdn.net/churximi/article/details/51648388 enumerate()说明 enumerate()是python的内置函数 enumerate在字典上是枚举、列举的意思 对于一个可迭代的(iterable)/可遍历的对象(...

2018-08-29 11:16:06

阅读数 43

评论数 0

python之collections之counter

  转自https://www.cnblogs.com/baotouzhangce/p/6179911.html 一、定义 Counter(计数器)是对字典的补充,用于追踪值的出现次数。 Counter是一个继承了字典的类(Counter(dict)) 二、相关方法 继承了字典...

2018-08-28 16:04:18

阅读数 170

评论数 0

初识机器学习——吴恩达《Machine Learning》学习笔记(二)

矩阵(matrices)和向量(vectors)矩阵(matrix)    定义:由数字组成的矩形阵列(Rectangular array of numbers)。矩阵其实是二维数组的另一种说法。    矩阵的维数(Dimension of matrix):矩阵的行数X矩阵的列数    矩阵的项(...

2018-07-05 12:01:12

阅读数 119

评论数 0

初识机器学习——吴恩达《Machine Learning》学习笔记(一)

Machine Learning的定义       AI发展出来的一个领域,计算机开发的一项新功能        定义一:        在没有明确设置的情况下,使计算机具有学习能力的研究领域。                          ——Samuel(1959)        定义二:...

2018-07-01 23:53:51

阅读数 1310

评论数 0

[Network] 计算机网络基础知识总结

阅读目录1. 网络层次划分2. OSI七层网络模型3. IP地址4. 子网掩码及网络划分5. ARP/RARP协议6. 路由选择协议7. TCP/IP协议8. UDP协议 9. DNS协议10. NAT协议11. DHCP协议12. HTTP协议13. 一个举例  计算机网络学习的核心内容就是网络...

2018-06-28 10:49:41

阅读数 94

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭