大数据
文章平均质量分 85
梦醒君04
这个作者很懒,什么都没留下…
展开
-
ambari安装 本地源
在配置ambari内容的设置,和本地源的内容原创 2022-09-13 17:00:20 · 1303 阅读 · 1 评论 -
约翰斯·霍普金斯大学全球新冠疫情统计数据
新华网和央视经常提到美国约翰斯·霍普金斯大学发布的新冠疫情最新统计数据,下面就公布一下网址:约翰斯·霍普金斯大学全球新冠疫情统计数据网址:约翰斯·霍普金斯大学全球新冠疫情统计比较难受的就是加载的确非常慢。大家有兴趣的可以试一试。...原创 2020-12-05 10:46:42 · 7962 阅读 · 0 评论 -
如何安装python环境(anaconda)
不说废话,直接上下载链接anaconda下载链接:https://pan.baidu.com/s/1Z0UK0PIDUJ15735r4Vm0yQ提取码:23ct如果你需要python安装教程,请点击:https://blog.csdn.net/ailuoyi521/article/details/106953273如果你需要图文安装教程,请往下看:第一步:下载好自己电脑合适版本的anaconda:不用纠结为什么这个安装包不叫python 而是叫anaconda,他是是一个python环境、工原创 2020-12-01 23:09:07 · 764 阅读 · 1 评论 -
python基础之——查看使用方法
python函数中的帮助方法话说python为何这么牛批,那还不是因为有大量的第三方库吗。但是第三方库用法多种多样,也不知道写的是什么内容,我们有没有什么办法来使用第三方库呢?其中python自带的一个help()函数,我们可以用上。在python的交互命令行下使用help()或在python文件中调用help()函数可以很方便的查看帮助。这样你就可以查看第三方库的一些用法了。一 查看所有的关键字:help(“keywords”)二、 查看模块查看python所有的modules:he原创 2020-07-23 13:53:09 · 1696 阅读 · 0 评论 -
python数据可视化入门——摆摊经济展示
数据爬的好,牢饭吃到饱——出自IT启蒙 大佬。数据应用的场景:在一些数据需求量大的企业,或者整合各个数据内容的企业或者个人,对于数据可视化以及数据分析内容还是有市场的。例如:最近比较火的巫师财经节目。网址如下:https://www.bilibili.com/video/BV1MJ411J7xV以下图表出自巫师财经,侵权亲联系本人删除。就像上图所显示内容。我们根据通过大量不可质感数据转化成显示成我们能直观看到的数据,并且数据分析人员可以通过数据表盘上的内容,来分析所需要的信息和趋势,预测原创 2020-06-22 17:31:44 · 435 阅读 · 0 评论 -
python 爬虫入门--热点视频爬取
我想大家对于爬虫也都多多少的都有点了解了。那么大家肯定想着爬取一些热点视频。那么这次还是使用大家熟悉的requests的我们首先获取一个视频网站的网址。import requestsresponse = requests.get('https://haokan.baidu.com')print(response.status_code)返回结果是200说明就是OK了。那么下边需要获取我们的热点内容。获取到这个内容,感觉就是json格式内存储的数据。一层一层打开这个内容我们可以获取原创 2020-06-18 13:31:49 · 995 阅读 · 0 评论 -
python 爬虫入门——selenium自动搜索小团团
这几天想到哪里写哪里,有可能有点乱。今天写一个selenium——WEB自动化工具,用来模拟操作人在运行浏览器。在爬虫中,可以作为一个自动化脚本来使用。先看一下先不说具体应用,大家也会觉得还是很有意思的对不对。from selenium import webdriverimport timedriver = webdriver.Chrome()driver.get("http://www.baidu.com")#输入小团团露脸视频driver.find_element_by_id("原创 2020-06-16 15:52:33 · 617 阅读 · 0 评论 -
python 爬虫入门——xpath获取文本信息
使用Xpath语法看前端一组HTML内容:页面信息htm = """<div> <ul> <li class="a1"><a href="network1.html">第一</a></li> <li class="a2"><a href="network2.html">第二</a></li> <li class="a3"><a href="netwo原创 2020-06-15 11:52:06 · 10274 阅读 · 2 评论 -
python 爬虫入门——获取页面代码
常见的爬虫有很多:requests库,lxml库,re库,bs4库,urllib库等。因为urllib是python自带的库,而包含urllib用法的requests库其实还挺好用的(各有各的好,这里先不比较)。这里看看爬虫requests库的使用。import requests# url返回百度response = requests.get("https://www.baidu.com")>>> response<Response [200]>返回结果是2原创 2020-06-14 15:50:03 · 8554 阅读 · 0 评论 -
python 爬虫入门--图片爬取
python 爬虫入门–图片爬取GitHub 地址: https://github.com/injetlee/Python/blob/master/%E7%88%AC%E8%99%AB%E9%9B%86%E5%90%88/meizitu.py爬取文字信息没难度?感觉太单调?那我们试试找一些图片爬取一下!首先了解看看文本信息和图片信息有何区别?<p>文本信息</p><a href="http://网址">百度链接</a><img src="原创 2020-06-09 17:29:46 · 1033 阅读 · 2 评论 -
python 爬虫入门--文字爬取
python 爬虫入门–文字爬取对于爬虫,相信大家都不陌生,但是如何入门,大家还是停留在了解认知阶段吗?那可以试试下边的方法,一起来试一下。首先我们试试爬取网页中的***文本信息***使用的是我们的一个requests 第三方库。#使用 import 导入requests库import requests# 使用requests库中 get方法,打开网址r = requests.get('https://www.qiushibaike.com/text/') #打印出网页HTML信息prin原创 2020-06-08 15:23:11 · 5053 阅读 · 1 评论