Python
一只神奇的暴躁
互联网金融行业数据从业者
展开
-
python 字典(dict)按键和值排序
python 字典(dict)的特点就是无序的,按照键(key)来提取相应值(value),如果我们需要字典按值排序的话,那可以用下面的方法来进行:1 下面的是按照value的值从大到小的顺序来排序。dic = {'a':31, 'bc':5, 'c':3, 'asd':4, 'aa':74, 'd':0}dict= sorted(dic.iteritems(), key=la转载 2016-08-12 21:02:56 · 3083 阅读 · 0 评论 -
pip 有代理情况下更新
python -m pip install --upgrade pip --proxy=10.10.100.100:8080原创 2019-03-13 17:44:21 · 877 阅读 · 0 评论 -
Python 数据挖掘 常用库
计算机视觉SimpleCV—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。使用Python编写,可以在Mac、Windows以及Ubuntu上运行。自然语言处理NLTK —一个领先的平台,用来编写处理人类语言数据的Python程序Pattern—Python可用的web挖掘模块,包括自然语言处理、机器学习等工具。TextBlob—为普通自原创 2017-08-22 10:53:18 · 1999 阅读 · 0 评论 -
python 数据预处理 数据抽样
简单随机抽样如果数据集是 dataframedf.simple(n)#从dataframe df中抽取n行数据df.simple(frac=0.8) #抽取80%的数据原创 2017-05-22 21:14:19 · 2482 阅读 · 0 评论 -
pyhton 数据预处理 数据读取与存储 csv
利用pandas 读取CSV到dataframeimport pandas as pddf= pd.read_csv('save.csv')#读取df.to_csv('out.csv')#存储原创 2017-05-22 16:51:28 · 860 阅读 · 0 评论 -
python 数据预处理 数据标准化
对每一列进行标准化(每个数值在0-1之间)import numpy as npimport pandas as pdnp.random.seed(1)df = pd.DataFrame(np.random.randn(4,4)* 4 + 3)方法一df=df.apply(lambda x: (x - np.min(x)) / (np.max(x) - np.min(x))) 方法二原创 2017-05-22 14:03:00 · 7375 阅读 · 0 评论 -
python 预测结果评价 准确率 精度 查全率 accuracy precision recall F1
对测试集进行0-1预测准确率:预测对的/总预测数,包括预测对的0也包括预测对的1,用处:代表着模型的整体准度,越高模型越准精度:预测为1的准确度,用处:代表着1的准度查全率:预测出的1占了真实1的百分比,用处:代表着预测1的覆盖情况举例:现在要推荐股票,分析师A,既想预测哪些要涨,又想预测哪些要跌,所以,他关注的是预测的准确度;分析师B,不求准确率,只求自己推荐的股票能涨,他关原创 2017-05-22 23:18:47 · 11451 阅读 · 0 评论 -
python 中如何判断list中是否包含某个元素
theList = ['a','b','c']if 'a' in theList: print 'a in the list'if 'd' not in theList: print 'd is not in the list'转载 2016-08-12 22:57:13 · 11712 阅读 · 0 评论 -
gensim做主题模型
作为python的一个库,gensim给了文本主题模型足够的方便,像他自己的介绍一样,topic modelling for humans具体的tutorial可以参看他的官方网页,当然是全英文的,http://radimrehurek.com/gensim/tutorial.html由于这个链接打开速度太慢太慢,我决定写个中文总结:(文章参考了52nl转载 2016-08-12 22:55:06 · 1286 阅读 · 0 评论 -
python 结巴分词(jieba)学习
原文 http://www.gowhich.com/blog/147源码下载的地址:https://github.com/fxsjy/jieba演示地址:http://jiebademo.ap01.aws.af.cm/特点1,支持三种分词模式: a,精确模式,试图将句子最精确地切开,适合文本分析; b,全模式,把句子中所有的可以成词的词语转载 2016-08-12 21:05:11 · 7258 阅读 · 0 评论 -
Jupyter快捷键
Jupyter Notebook 的快捷键Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。命令模式 (按键 Esc 开启)Enter: 转入编辑模式Shift-Enter: 运行本单元,选中下个单元Ctrl-Enter: 运行本单元Alt-Enter: ...原创 2019-09-03 14:03:03 · 126 阅读 · 0 评论