爬取同花顺HS300成分股的预测收益及增长率

import requests from bs4 import BeautifulSoup import re import json import numpy as np import time import tushare as ts import pandas as pd df1 = ts...

2019-04-26 14:41:43

阅读数 95

评论数 0

pandas_datareader.data 获取雅虎财经股票数据并以csv格式存放

pandas_datareader.data 获取雅虎财经股票数据并以csv格式存放 import numpy as np import pandas as pd import pandas_datareader.data as web import datetime '''pd.read_cs...

2019-03-14 23:02:08

阅读数 394

评论数 0

量化交易-获取5日,10日,20日均线数据

#获取5日,10日,20日均线数据 import tushare as ts import talib from matplotlib import pyplot as plt #通过tushare获取股票信息 df=ts.get_k_data('601888',start='2018-01-...

2018-11-06 14:34:48

阅读数 1686

评论数 0

selenium自动翻页抓取保监会数据

一、背景: 在抓取保监会官网产品检索页面下的所属公司,产品名称,备案日期,险种时,页面较多需要翻页抓取,经分析,在点击下一页,网页的url没有任何变化,只是用js去加载了新的数据,然后动态地改变了table里面的数据。这可和本菜以前爬的页面可不一样,所以这次要想办法模拟翻页,然后重新读取新的htm...

2018-11-02 12:22:25

阅读数 243

评论数 0

selenium入门及深入

selenium用法详解 Python 爬虫基础Selenium库的使用

2018-11-01 11:19:28

阅读数 118

评论数 0

Python3 基本数据类型

数字(Number)类型 python中数字有四种类型:整数、布尔型、浮点数和复数。 int (整数), 如 1, 只有一种整数类型 int,表示为长整型,没有 python2 中的 Long。 bool (布尔), 如 True。 float (浮点数), 如 1.23、3E-2 complex...

2018-10-27 16:45:13

阅读数 28

评论数 0

用Python爬取猫眼电影排行榜TOP100

用Python爬取猫眼电影排行榜TOP100 参考资料《Python3网络爬虫开发实践》,作者崔庆才 这篇博客参考了崔庆才的《Python3网络爬虫开发实践》有关部分,记录了爬取猫眼电影网排名前100的电影信息的过程。 主要步骤有: 访问网站,获取页面源码 解析页面,得到想要的数据 循环爬取多...

2018-10-07 15:38:15

阅读数 463

评论数 2

Python3学习的实用教程 (持续更新)

廖雪峰的官方网站:https://www.liaoxuefeng.com/ Python3网络爬虫开发实战教程:https://cuiqingcai.com/5052.html python官方指南:https://www.python.org/about/gettingst...

2018-08-29 11:26:12

阅读数 174

评论数 1

做量化你需要知道的那些术语!(持续更新)

**金融相关: 股票:股份公司发行的所有权凭证。 债券:承诺按一定利率支付利息并按约定条件偿还本金的债权债务凭证,风险较低。 固定收益:固定收益类投资指投资于银行定期存款、协议存款、国债、金融债、企业债、可转换债券、债券型基金等固定收益类资产。风险低。 利率互换:利率互换是指两笔货币相同、...

2018-08-23 16:50:38

阅读数 621

评论数 0

MySQL统计某列各字段的数量及某列中各字段占所有类型的百分比

SELECT SYSTEM,a.cnt,CONCAT(ROUND(a.cnt/b.sum *100,2),'','%') FROM ( select SYSTEM, count(SYSTEM) AS cnt from nginx_log_resource GROUP ...

2018-08-22 16:57:59

阅读数 3692

评论数 0

分别使用urllib和requests获取网页html.py

#使用urllib库获取html内容 from urllib import request url = '' html = request.urlopen(url).read() html.decode() #使用requests获取html内容 import requests url = ''...

2018-08-16 11:35:51

阅读数 1394

评论数 0

jupyter notebook下 采集标题和文本并存入txt文档.py

######jupyter notebook下采集苏轼的一首词 import requests from bs4 import BeautifulSoup import re import os import pandas as pd url = 'http://www.shicimingju...

2018-08-14 10:59:30

阅读数 787

评论数 0

利用正则爬取东方财富网股吧评论.py

###正则爬取东方财富网股吧评论 import requests import re from bs4 import BeautifulSoup url = 'http://guba.eastmoney.com/list,002769.html' res = requests.get(url) ...

2018-08-14 10:56:23

阅读数 1021

评论数 0

爬取新浪网新闻标题日期网址.py

import requests from bs4 import BeautifulSoup url =’http://news.sina.com.cn/china/’ res = requests.get(url) res.encoding = ‘utf-8’ soup = Beauti...

2018-08-10 12:37:17

阅读数 156

评论数 0

提示
确定要删除当前文章?
取消 删除