自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 企查查参数问题

企查查请求头加密反破解

2022-12-05 18:14:43 629

原创 实战项目 1:5 行代码爬取国内所有上市公司信息

入门爬虫首先来看要爬取的目标网站:目标网站网页中有一张表格,内容是全国上市公司相关信息,整个表格有 180 页。我们需要做的工作就是,用几十秒钟把表格所有数据爬取下来,接着保存到本地文件。试想如果不会爬虫,要完成这份工作得费多大力气。为什么要以这个网页作为第一个爬虫案例呢?有两点原因:这类表格型数据在网页中非常常见,学会这个爬虫就能爬取一大类的网页数据,很实用。这个爬虫很简单,5 行代...

2019-12-16 15:32:47 1047 1

原创 电脑弹窗终极解决办法

1.用快捷键win+r打开运行窗口,或者在开始菜单里面输入运行来打开。2.在命令行里输入msconfig,点击确定。如下图3.在打开的系统配置项中选择“启动”,然后如果需要打开任务管理器就直接打开,最后将所有的开机选项选择禁用。...

2019-12-04 11:41:33 1006

原创 关于图片的爬取与保存到本地——简单易上手

爬取网址:https://v.paixin.com/声明:本篇博客只是为了分享技术,严禁转载用于商用,后果自负。抓取步骤:1.输入关键词;此处输入‘打架’2.获取ID直接上代码:import requestsimport spider_tools as timport timeheader=t.str2dict('''Content-Type: application/js...

2019-12-02 17:56:49 332

原创 Matplotlib使用样式表自定义绘图

使用样式表自定义绘图style包为易于切换的绘图『样式』增加了支持,它们与matplotlibrc文件参数相同。他所包含的样式有:‘bmh’, ‘classic’, ‘dark_background’, ‘fast’, ‘fivethirtyeight’, ‘ggplot’, ‘grayscale’, ‘seaborn-bright’, ‘seaborn-colorblind’, ‘seabo...

2019-11-29 11:16:45 209

转载 python数据分析与数据挖掘库介绍

一、数据预处理由于采集数据中常包含许多含有噪声、不完整、甚至不一致的数据,对数据挖掘所涉及的数据对象必须进行预处理。主要包括筛选数据、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据违约等。二、常用的数据挖掘工具1.SAS Enterprise Miner2.IBM SPSS Moldelre3.SQL Sever4.Python在这里主要选用python...

2019-11-28 15:36:28 723

原创 转行半年总结

时间过得真快,转眼间转行互联网已经快半年了,想借这篇文章总结一下这小半年的工作生活情况,也是对自己的一个复盘。我自己转行的跨度很大,转行前后各方面的情况天差地别,但唯一不变的是两个行业都是比较辛苦——从工程狗到程序狗。  具体说一下我的工作经历吧:  大学读的是工程力学,双一流学校,实话实说,这个专业现在很尴尬。18年七月年毕业去了一家施工单位,做了大半年的技术员,坐标是贵州的一个小...

2019-11-28 10:52:49 1485 1

原创 新晋菜鸟--学习进度总结

目录一、爬虫篇二、目前在爬虫中遇到的问题有三、 基于TensorFlow的舆情分类深度学习算法篇四、RPA篇2019年7月1日,正式入职撼地大数据,激动混杂着伤感的情感说不清。前几个月还在工地挖隧道,转眼之间就坐在了梦寐以求的写字楼里面敲代码,以为自己的人生从此将开启新的篇章,殊不知,其实只是从一个围城跳到另一个围城罢了。简而言之,只是换了一个新的战场,只不过这个战场能看到希望,这段时间...

2019-07-21 22:31:59 181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除