分享
奔跑的乌班
wobuxiangxie
展开
-
糗事百科爬虫实现
前两天写了一下关于糗百的爬虫,现在将代码分享给大家,有兴趣的同学可以了解一下1,下面是正常流程实现爬虫过程的源代码,如下:# coding=utf-8import requestsimport jsonfrom lxml import etreeclass QiubaiSpider: def __init__(self): self.part_url = 'h...原创 2018-12-28 11:00:03 · 155 阅读 · 0 评论 -
One-Hot 编码
独热编码即 One-Hot 编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。独热编码恰好是一种解决上述问题的好办法。不过数据也因此变得稀疏。[{‘city’: ‘北京’,‘location’:‘北方’,‘temperature’:100},{‘city’: ‘上海’,‘location’:‘南方’,‘tem...原创 2019-03-20 15:16:29 · 567 阅读 · 0 评论