- 博客(6)
- 资源 (3)
- 收藏
- 关注
原创 第二题自己的代码
from selenium import webdriverfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.common.by import Bydriver = webdriver.Chrome()driver.get(“https://www.runoob.c
2021-10-23 08:23:06 53
原创 第四题自己的代码
import matplotlib.pyplot as pltimport pandas as pddata = pd.read_excel('trd.xlsx')data#data.交易日期 =pd.to_datetime(data.交易日期)datanew = data[(data.股票代码==600000)&(data.交易日期>='2017-01-03')&(data.交易日期<='2017-01-20')]datanew````pythonfig
2021-10-22 22:48:02 55
原创 第三题自己的答案
import numpy as npimport pandas as pddata = pd.read_csv("data_etr.csv")df = data.pivot(values='KWH',index='DATA_DATE',columns='CONS_NO')dfQL = df.quantile(0.25)QU = df.quantile(0.75)IQR = QU-QLdf[((df>QU+1.5*IQR)|(df<QL-1.5*IQR))]=Nonedf
2021-10-22 22:04:38 83
原创 第四题代码
文件读取及查看import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata=pd.read_excel(’/data/trd.xlsx’,engine=“openpyxl”)#查看列名和数据print(data.columns)print(data.iloc[:5])提取股票代号600000在2017年1月3日至2017年1月20日的收盘价格数据,并绘制股票价格走势图dt=data.loc[data[.
2021-10-22 21:24:28 275
原创 官方练习题
一、 大数据平台组件搭建。要求在Hadoop集群上搭建1.6.3版本的Spark分布式集群。(提示如下,注意每一步骤的代码与结果需截图在报告中体现)1.Spark安装包处理,解压到/usr/local目录下,在master节点通过命令“wget -P /opt http://datasrc.tipdm.net:81/bigdata/spark/software/spark-1.6.3-bin-hadoop2.6.tgz”进行获取。2.Spark配置文件修改(spark-env.sh、slaves、sp
2021-10-22 20:31:03 162
原创 爬虫动态网页(原)
import requestsfrom lxml import etreeurl=“https://www.qq.com/”rqq = requests.get(url)html = etree.HTML(rqq.text)html.xpath("//a/text()")import requestsfrom lxml import etreerqq = requests.get(“https://www.zhipin.com/job_detail/?query=%E6%95%B0%E6%8
2021-10-21 20:53:40 98
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人