dbd数据-CSDN博客

原创实战项目 1：5 行代码爬取国内所有上市公司信息

入门爬虫首先来看要爬取的目标网站：目标网站网页中有一张表格，内容是全国上市公司相关信息，整个表格有 180 页。我们需要做的工作就是，用几十秒钟把表格所有数据爬取下来，接着保存到本地文件。试想如果不会爬虫，要完成这份工作得费多大力气。为什么要以这个网页作为第一个爬虫案例呢？有两点原因：这类表格型数据在网页中非常常见，学会这个爬虫就能爬取一大类的网页数据，很实用。这个爬虫很简单，5 行代...

2019-12-16 15:32:47 1047 1

原创电脑弹窗终极解决办法

1.用快捷键win+r打开运行窗口，或者在开始菜单里面输入运行来打开。2.在命令行里输入msconfig，点击确定。如下图3.在打开的系统配置项中选择“启动”，然后如果需要打开任务管理器就直接打开，最后将所有的开机选项选择禁用。...

2019-12-04 11:41:33 1006

原创关于图片的爬取与保存到本地——简单易上手

爬取网址：https://v.paixin.com/声明:本篇博客只是为了分享技术，严禁转载用于商用，后果自负。抓取步骤：1.输入关键词；此处输入‘打架’2.获取ID直接上代码：import requestsimport spider_tools as timport timeheader=t.str2dict('''Content-Type: application/js...

2019-12-02 17:56:49 332

使用样式表自定义绘图style包为易于切换的绘图『样式』增加了支持，它们与matplotlibrc文件参数相同。他所包含的样式有：‘bmh’, ‘classic’, ‘dark_background’, ‘fast’, ‘fivethirtyeight’, ‘ggplot’, ‘grayscale’, ‘seaborn-bright’, ‘seaborn-colorblind’, ‘seabo...

2019-11-29 11:16:45 209

转载 python数据分析与数据挖掘库介绍

一、数据预处理由于采集数据中常包含许多含有噪声、不完整、甚至不一致的数据，对数据挖掘所涉及的数据对象必须进行预处理。主要包括筛选数据、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据违约等。二、常用的数据挖掘工具1.SAS Enterprise Miner2.IBM SPSS Moldelre3.SQL Sever4.Python在这里主要选用python...

2019-11-28 15:36:28 723

原创转行半年总结

时间过得真快，转眼间转行互联网已经快半年了，想借这篇文章总结一下这小半年的工作生活情况，也是对自己的一个复盘。我自己转行的跨度很大，转行前后各方面的情况天差地别，但唯一不变的是两个行业都是比较辛苦——从工程狗到程序狗。　　具体说一下我的工作经历吧：　　大学读的是工程力学，双一流学校，实话实说，这个专业现在很尴尬。18年七月年毕业去了一家施工单位，做了大半年的技术员，坐标是贵州的一个小...

2019-11-28 10:52:49 1485 1

原创新晋菜鸟--学习进度总结

目录一、爬虫篇二、目前在爬虫中遇到的问题有三、基于TensorFlow的舆情分类深度学习算法篇四、RPA篇2019年7月1日，正式入职撼地大数据，激动混杂着伤感的情感说不清。前几个月还在工地挖隧道，转眼之间就坐在了梦寐以求的写字楼里面敲代码，以为自己的人生从此将开启新的篇章，殊不知，其实只是从一个围城跳到另一个围城罢了。简而言之，只是换了一个新的战场，只不过这个战场能看到希望，这段时间...

2019-07-21 22:31:59 181

JDance1978的博客

原创企查查参数问题