- 博客(10)
- 资源 (7)
- 收藏
- 关注
原创 python获取数据——数据爬虫——代理池随机使用代理
proxy_list = [ 'http://117.177.250.151:8081', 'http://111.85.219.250:3129', 'http://122.70.183.138:8118', ]proxy_ip = random.choice(proxy_list) # 随机获取代理ipproxies = {'http': proxy_ip...
2019-01-18 15:48:07 4817
原创 python数据处理——numpy矩阵操作,取其中的一行或一列
>>> import numpy as np>>> a = np.array(9).reshape(3,3) 另外再重申一下构建一个初始化的矩阵的办法:如下面这个构建一个从0到8的3*3矩阵>>> a = np.arange(9).reshape(3,3)>>> aarray([[0, 1, 2], ...
2019-01-17 12:32:15 11111 1
原创 python数据处理——关于python包的版本的一项教训
在python里面,最怕的是什么情况?莫名其妙的问题,大多数都是版本导致的,所以在安装一个新的包的时候,如果看到了提示version:XXX>=0.xx.xx,毫无疑问,你需要做的就是在安装时候指定版本 pip install xxx==0.xx.xx,即按照最低版本来配置,就不会有问题不要觉得,新的版本会多么多么好什么的,很有可能是删除了你用的很得心应手的特性,很有可能是增加了坑爹...
2019-01-14 12:23:13 457
原创 个人感悟——学习成长过程中的一些感觉
高中学习时候老师一直提醒我们要写错题本,对于错误及时记录,然而我们却只顾着解决问题,而没有去及时整理错误,其实要知道慢就是快,越慢就是越快,要耐心,心情要好。我记得一个很清晰的例子就是当时班里有一些同学,刷题非常快,在我还没有完成老师布置任务,没有好好整理错题的时候,他们就已经完成了自己去额外买的卷子。我一度很恐慌,后来他们都没我考试考的好,高考也没我考的好,我就释然了,在我看来慢就是快,认真...
2019-01-12 19:13:36 946
原创 格式化选取EXCEL字符串中的数字
嗯,其实真正的那种正则化选取的方法我还没有找到,但是我写的这个方法可以解决一定的需求了,所以在此记录一下:需求:对excel文件中一列单元格的字符串中选取其中的数字,然后对后面的内容进行排序,如:excel自己的排序就是一位一位的排,这里需要使用excel字符串操作的三个函数:LEFT(TEXT,len())RIGHT(TEXT,len(text))LEN()简单说明一下...
2019-01-12 19:10:54 1680
原创 python数据处理——pandas Dataframe.mean()没有返回值,返回series[]
博主真真是个遍历BUG的小能手,这个问题的原因是在pd.read_csv()之类的操作时候,没有指定数值类型,导致的这个问题,因此包括在内的,数值运算之后数据变得很奇怪啊,数据为nan啊之类的问题都有解了,所以说,在read的时候,dtype一下,是一种态度要问我怎么发现的,我在使用DEBUG功能时候,使用了这个函数:意思就是对dataframe的某一列求均值啦,返回typeerror,我...
2019-01-11 10:12:14 6028 2
原创 金融数据时间序列分析——模型准确率过高怎么办
多少年后,小f想起了自己还是刚刚出道的小萌新时候犯的一个错误,当时模型的准确率贼高,高的离谱,就像下面这种情况 precision recall f1-score support -1 1 1 1 1934 0 1 1 ...
2019-01-10 17:58:33 2171
原创 金融数据时间序列分析——关于数据集不平衡的思考
这真是一个比较纠结的问题,网上很多关于数据集不平衡处理方法的技术,但是直面金融数据时间序列分析的?没有?我也没有什么资格可以评判什么,这里写的就是一个大四转行学生对于这些问题的一些思考吧。。首先是采样,这里的内容来自这里:链接1. 采样采样方法是通过对训练集进行处理使其从不平衡的数据集变成平衡的数据集,在大部分情况下会对最终的结果带来提升。采样分为上采样(Oversamplin...
2019-01-08 11:42:27 2417
原创 因子研究阅读分析——追踪聪明钱 - A股市场交易的微观结构初探
文章的reference:方正证券研究所的研报『跟踪聪明钱-从分钟线到选股因子』、原文链接:https://zhuanlan.zhihu.com/p/21653794大概思路:在一个非完全有效的市场中,信息的传播总是一个从点到面的过程,这一过程中最先接触到信息的投资者当然具有巨大的优势,研报中试图通过分钟线的交易数据来寻找这些最先接触到信息的资金的动向,这些资金我们称之为“聪明钱”文章...
2019-01-05 18:51:32 1333
原创 python数据处理——pandas进行数据变频或插值
这里首先要介绍官方文档,对python有了进一步深度的学习的大家们应该会发现,网上不管csdn或者简书上还是什么地方,教程来源基本就是官方文档,所以英语只要还过的去,推荐看官方文档,就算不够好,也可以只看它里面的sample就够了好了,不说废话,看我的代码:import pandas as pdimport numpy as nprng = pd.date_range('201801...
2019-01-03 20:59:47 5771 1
opengl的3d漫游迷宫源码
2017-10-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人