自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 用python远程连接windows服务器并上传数据

第一次玩服务器,电脑端远程连接能连上,可SSH却始终不行,后来才发现,这根本不是一种东西,SSH得在服务器上搭建SSH sever服务。好吧,那去网上搜资料,可结果出来的都是一大堆一大堆Linux服务器的教程,实在是蛋疼,就不能考虑一下Windows用户的感受吗?!后来终于找到了一两篇教怎么在Windows上搭SSH的,再找了点python 使用ssh的教程,加上我过人的智慧,终于成功地用...

2018-11-21 08:40:37 8569 2

转载 从爬取豆瓣影评到基于朴素贝叶斯的电影评论情感分析(下)

基于朴素贝叶斯的电影评论情感分析用到的包:pandas、jieba(分词工具)file=open(r"review.txt",'r',encoding='utf-8')reviews=file.readlines()data=[]for r in reviews: data.append([r[0],r[2:]])d1=pd.DataFrame(data)pd.set_...

2018-08-20 18:53:18 6379 19

原创 动态爬取链家二手房成交记录并保存至Excel

 一、先观察网页结构链家成交记录网址:https://bj.lianjia.com/chengjiao/每页有30条成交记录,点击记录提示要下载APP才能查看详细信息。不管它,我们直接审查元素,找到成交记录的链接,点击打开。如下图                                     链接后面有一串数字,应该是这个成交记录的id号,由于记录每日更新,我们每次爬...

2018-08-19 14:37:54 5166 3

原创 从爬取豆瓣影评到基于朴素贝叶斯的电影评论情感分析(上)

一、爬取豆瓣影评    基本思路:先获取每个电影的评论区链接,然后依次进入其评论区爬取评论。选取10部电影,每部200条评论。    用到的包为:BeautifulSoup,urllib    这里选取的链接为:豆瓣电影,打开后内容如下:                                 直接审查元素,找到每部电影的标签位置,如下图:             ...

2018-07-15 08:26:18 8703 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除