- 博客(8)
- 收藏
- 关注
原创 实战项目 1:5 行代码爬取国内所有上市公司信息
入门爬虫首先来看要爬取的目标网站:目标网站网页中有一张表格,内容是全国上市公司相关信息,整个表格有 180 页。我们需要做的工作就是,用几十秒钟把表格所有数据爬取下来,接着保存到本地文件。试想如果不会爬虫,要完成这份工作得费多大力气。为什么要以这个网页作为第一个爬虫案例呢?有两点原因:这类表格型数据在网页中非常常见,学会这个爬虫就能爬取一大类的网页数据,很实用。这个爬虫很简单,5 行代...
2019-12-16 15:32:47 1047 1
原创 电脑弹窗终极解决办法
1.用快捷键win+r打开运行窗口,或者在开始菜单里面输入运行来打开。2.在命令行里输入msconfig,点击确定。如下图3.在打开的系统配置项中选择“启动”,然后如果需要打开任务管理器就直接打开,最后将所有的开机选项选择禁用。...
2019-12-04 11:41:33 1006
原创 关于图片的爬取与保存到本地——简单易上手
爬取网址:https://v.paixin.com/声明:本篇博客只是为了分享技术,严禁转载用于商用,后果自负。抓取步骤:1.输入关键词;此处输入‘打架’2.获取ID直接上代码:import requestsimport spider_tools as timport timeheader=t.str2dict('''Content-Type: application/js...
2019-12-02 17:56:49 332
原创 Matplotlib使用样式表自定义绘图
使用样式表自定义绘图style包为易于切换的绘图『样式』增加了支持,它们与matplotlibrc文件参数相同。他所包含的样式有:‘bmh’, ‘classic’, ‘dark_background’, ‘fast’, ‘fivethirtyeight’, ‘ggplot’, ‘grayscale’, ‘seaborn-bright’, ‘seaborn-colorblind’, ‘seabo...
2019-11-29 11:16:45 209
转载 python数据分析与数据挖掘库介绍
一、数据预处理由于采集数据中常包含许多含有噪声、不完整、甚至不一致的数据,对数据挖掘所涉及的数据对象必须进行预处理。主要包括筛选数据、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据违约等。二、常用的数据挖掘工具1.SAS Enterprise Miner2.IBM SPSS Moldelre3.SQL Sever4.Python在这里主要选用python...
2019-11-28 15:36:28 723
原创 转行半年总结
时间过得真快,转眼间转行互联网已经快半年了,想借这篇文章总结一下这小半年的工作生活情况,也是对自己的一个复盘。我自己转行的跨度很大,转行前后各方面的情况天差地别,但唯一不变的是两个行业都是比较辛苦——从工程狗到程序狗。 具体说一下我的工作经历吧: 大学读的是工程力学,双一流学校,实话实说,这个专业现在很尴尬。18年七月年毕业去了一家施工单位,做了大半年的技术员,坐标是贵州的一个小...
2019-11-28 10:52:49 1485 1
原创 新晋菜鸟--学习进度总结
目录一、爬虫篇二、目前在爬虫中遇到的问题有三、 基于TensorFlow的舆情分类深度学习算法篇四、RPA篇2019年7月1日,正式入职撼地大数据,激动混杂着伤感的情感说不清。前几个月还在工地挖隧道,转眼之间就坐在了梦寐以求的写字楼里面敲代码,以为自己的人生从此将开启新的篇章,殊不知,其实只是从一个围城跳到另一个围城罢了。简而言之,只是换了一个新的战场,只不过这个战场能看到希望,这段时间...
2019-07-21 22:31:59 181
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人