Python机器学习2-股票信息简单抓取

原创 2015年11月19日 23:26:27

腾讯提供了获取股票信息的接口

通过urllib2获取sh601318中国平安的股票信息详情,直接解析出结果,后续需将结果保存并分析。

代码如下:

# -*- coding:gbk -*-

import urllib2

names = [
#'详情',
'名字',
'代码',
'当前价格',
'昨收',
'今开',
'成交量(手)',
'外盘',
'内盘',
'买一',
'买一量(手)',
'买二',
'买二量(手)',
'买三',
'买三量(手)',
'买四',
'买四量(手)',
'买五',
'买五量(手)',
'卖一',
'卖一量',
'卖二',
'卖二量',
'卖三',
'卖三量',
'卖四',
'卖四量',
'卖五',
'卖五量',
'最近逐笔成交',
'时间',
'涨跌',
'涨跌%',
'最高',
'最低',
'价格/成交量(手)/成交额',
'成交量(手)',
'成交额(万)',
'换手率',
'市盈率',
'未知40',
'最高',
'最低',
'振幅',
'流通市值',
'总市值',
'市净率',
'涨停价',
'跌停价'
]

def getStockDetail(num):
    print "股票代码: " + num
    f = urllib2.urlopen('http://qt.gtimg.cn/q='+ str(num))
    text = f.readline()
    stmp=text[14:-3]
    slist=stmp.split('~')
    #print slist
    
    if(len(slist) < len(names)):
        print("[ERROR]return '%s' is not value"%text)
        return

    print('*******************************')
    i = 0
    for item in names:
        if i == 28:
            print item + ":"
            details=slist[i].split('|')
            for detail in details:
                sb = detail.split('/')
                if sb[3] == 'S':
                    print sb[0] + " 卖出价 " + sb[1] + " 卖出额 " + sb[2]
                else:
                    print sb[0] + " 买入价 " + sb[1] + " 买入额 " + sb[2]
                
        else:
            print item + ":" + slist[i]
        i = i + 1
    print('*******************************')

if __name__ == '__main__':
    getStockDetail('sh601318')



运行结果:


版权声明:本文为博主原创文章,未经博主允许也可以随便转载。

相关文章推荐

[python爬虫]selenium+PhantomJS模拟登陆

selenium+PhantomJS来做爬虫的话可以做到完全模拟浏览器的操作,就避开的很多后台的通信,过程会简单很多,很多web自动化测试也是用selenium来做的呢,但是这样的缺点就是慢,运行过程...

python selenium,PhantomJS运用 抓取滚动条滚动加载的页面, js动作操作,模拟登陆

1、运用 #!/usr/bin/python #encoding=utf-8 import sys from selenium import webdriver reload(sys) sys.se...

简单Python3爬虫程序(5)进阶:知乎网的登录与用户相关信息爬取

下面是在Python3上的代码,这次觉得麻烦就没有分成两个模块了,本来想爬的是每个用户的主页,但是正则没有写好,所以就爬取了所有与用户相关的信息: import gzip import re from...

Python 爬虫 PhantomJs 获取JS动态数据

Python 爬虫 PhantomJs 获取JS动态数据 字数2034 阅读2900 评论16 喜欢8 上篇文章我非常high的爬取了一个正常网页的数据 对是正常 不正...

Python使用Selenium和PhantomJS解析动态JS的网页

From:http://blog.mimvp.com/2014/08/python-with-selenium-and-phantomjs-analysis-of-dynamic-js-pages/ ...

Python机器学习3-沪深全部股票抓取、保存

通过对腾讯证券网页以下分析 http://stockapp.finance.qq.com/mstats/#mod=list&id=bd012057&module=SS&type=pt012057, ...

php实现 DES/CBC/PCCS5padding 加解密模式

<?php /* 名称:DES/CBC/PCCS5padding 模式加解密测试模块 功能:测试 使用 DES/CBC/PCCS5padding 模式进行加解密的模块 作者: 更新...

Python中使用PhantomJS抓取Javascript网页数据

有些网页不是静态加载的,而是通过javascirpt函数动态加载网页,比如下面这个网页,表格中的看涨合约和看跌合约的数据都是通过javascirpt函数从后台加载。仅仅使用beautifulsoup并...

[Python爬虫] 在Windows下安装PIP+Phantomjs+Selenium

最近准备深入学习Python相关的爬虫知识了,如果说在使用Python爬取相对正规的网页使用"urllib2 + BeautifulSoup + 正则表达式"就能搞定的话;那么动态生成的信息页面,如A...

python基于selenium+PhantomJS实现搜索交互案例

做python爬虫测试。找了一个比较好测试的网站,基于selenium+PhantomJS填写表单在提交获取结果的功能。 至于开发的环境: 环境是windows,python版本为3.5.2。se...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)