自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 python request 淘宝评论数据简易爬虫

淘宝商品的评价数据非常具有研究意义,可以尝试作为神经网络RNN的训练原料。我们使用python中的request库可以直接爬取评论数据,并不需要任何其他框架以及浏览器支持。1,我们要爬取的淘宝商品页,我们可以看到地址栏中id=*************显示的内容是商品在数据库中的id2,评论所在位置的真实url,以刚刚的宝贝为例,https://rate.taobao.com/feedRateLi...

2018-05-04 21:15:21 3024 1

原创 用简易数据挖掘觅食(献丑)

用简易数据挖掘觅食(献丑)今天给大家营造一种书本知识也能解决实际问题的错觉。数据来源:大众XX   使用工具 python爬虫,pandas,seaborn第一步,用python爬虫从大众XX抓取所有的“淮扬菜”  ,并且进行结构化预处理,大概就是下面这个样子,排序是大众XX上显示的顺序(狗企鹅) 第二步,获取需要

2017-08-08 11:51:37 374

原创 简易连接器对付建立数据库连接时的connection timeout

最近做项目,数据库用的百度的RDS MYSQL,非常坑爹,十次连接至少三次是connection timeout。一直找不到比较合适的解决方法。搜索到的内容都与这个问题无关,都是已经建好的连接超时,但是没有提到怎么才能处理建立连接的时候超时这种坑爹问题。这次就做了一个连接拨号器,是在普通的数据库连接器的基础上改进的,原理也很简单。上代码。代码的主体思路就是用三个内部类线程同时进行拨号,拨号成功

2017-02-24 17:52:14 2543

原创 一键解决Myeclipse引起的PKIX:unable to find valid certification path to requested target

解决pkix报错的方法,更换myeclipse的运行环境

2016-12-04 11:23:08 510

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除