- 博客(5)
- 收藏
- 关注
原创 Python调用百度AIP进行文字识别
前言这是我以前参考百度官方文档写的,平时做课题报告遇到不好复制文献会用这个来进行文字识别(虽然没有别人写成软件的方便)。正文不多废话直接上代码from aip import AipOcr""" 你的 APPID AK SK """APP_ID = ''API_KEY = ''SECRET_KEY = ''client = AipOcr(APP_ID, API_KEY, SEC...
2019-02-18 12:29:59 7279 3
原创 Pycharm打开(打印)大数据文件显示不全的解决方法
前言昨晚写了个小爬虫,简单分析下发现可以修改请求的url,直接获取所有目标的数据。想先打印在控制台看看,发现打印的数据不全,一开始还以为被反爬虫了,获取的数据本身不全,后来将数据直接保存JSON文件(3兆多大小),用Ubuntu文档编辑器打不开(直接卡死),用vim打开发现数据完整(说明爬虫获取的数据本身没毛病),再在Pycharm用Pthon打开发现提示文件过大,打印在控制台也还是显示不全,在...
2019-02-17 17:43:03 17810 9
原创 申请阿里云SSL证书进行https访问
前言我的小破站基本已经成型,唯一美中不足的就是还不能进行https安全访问,所以就顺便去阿里云免费申请了SSL证书,申请过程比较简单,就是阿里云平台好像有bug,在域名控制台那申请的证书操作审核有问题,需要去购买平台上买,再去SSL证书管理控制台上操作,审核好后直接下载下来即可(服务器Nginx)。正文上传证书到Vultr服务器scp /path/filename root@server...
2019-02-13 16:27:34 385
原创 【python爬虫】全国大学生创业服务网项目按高校分类查询
前言这是本站的第一篇博客,本来想写些环境搭建的,但是基本上所需的环境我都已经搭建好了,以后如果遇到再说吧。过年在家闲的无聊,到全国大学生创业服务网上随便看看找点灵感,想看看自己学校有哪些项目,发现其导航分类竟然没有按高校分,因此我写了个小爬虫按高校分类抓数据。正文对数据内容进行分类查询,下一页等操作发现网站url无变化,心想这又是要抓Ajax数据啊
2019-02-10 16:57:59 2223 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人