![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 62
siyuchen1
这个作者很懒,什么都没留下…
展开
-
Python数据分析之可视化一matplotlib(常用方法)
data = sns.load_dataset("iris")data.head()# 萼片长度,萼片宽度,花瓣长度,花瓣宽度,种类# your code%matplotlib inlineimport matplotlibfrom matplotlib import pyplot as pltimport seaborn as snsimport pandas as pddata....原创 2018-02-28 16:09:37 · 1187 阅读 · 3 评论 -
NLP之一nltk,nltk的安装步骤,使用简介
聊天机器人现在这么火,但是基础离不开NLP,Python自带的nltk就是自然语言处理的一大利器。今天就为大家介绍下nltk。一、nltk的安装Windows版本:首先安装个Python,最好需要3.4及以上版本顺便也安装个numpy吧安装NLTK,NLTK:http://pypi.python.org/pypi/nltk测试安装是否成功:输入Python,进入Python环境;然后import ...原创 2018-04-22 10:43:21 · 1297 阅读 · 0 评论 -
聊天机器人——chatBot知识框架
Generative-Based:IT语料库加电影对白语料库,通过简单的案例,把IT所有知识,强AI形式,目前还没有被攻克,不错的paper:ACL会议,主题是使用了一堆词条,假设可以涵盖了社会的方方面面的知识,维基百科,词条的形式进行分析,你问题都以维基百科的知识回答;Retrieval-Based:闭合的场景,所有的问题基本都能想得到,Rules-Based,工业界很感兴趣,加入知识图谱中的动...原创 2018-04-22 20:59:42 · 1964 阅读 · 0 评论 -
搭量化数据库——互联网金融之三
一、数据的获得与存储http://tushare.org/index.htmlhttp://finance.yahoo.comhttps://www.google.com/financehttps://www.quantquote.com二、搭自己的数据库创建库、创建表三、Python同数据库连接数据导入、可视化四、时间序列分析实战建立本地金融数据库的意义建模:模型建立、模型评估、模型回测、风险控...原创 2018-05-02 14:01:45 · 698 阅读 · 0 评论 -
量化交易实战——互联网金融之四
传统的交易系统策略——是人工定义的。现在的机器学习——规则不是程序员制定的,而是自己学出来的,规则是计算机从数据中挖掘出来的。识别手写模型用的SVM,有很强的鲁棒性;监督模型:分类、回归。非监督模型:没有Y的信息,从X里面能不能自己发现规律;聚类、降维。X是300*1的点,每个时间点有300个指标,用聚类的方法,这些时间序列归一类,另一些时间序列归另一类;300维能不能降到20维,300维某些列是...原创 2018-05-06 07:45:45 · 598 阅读 · 2 评论 -
量化交易系统综述——互联网金融之二
一、CAPM modelprotfolio:资产的组合,如果不考虑融券,各种资产占总资产的比重;maket profolio:市场股指选定10个板块,每个板块挑出来比较重要的股票,每个股票的市值乘以权重,加权求和,代表了市场的指标,类似于GDP代表国家经济状态的指标。股指的波动不代表某个股票的波动。ts时刻,某只股票的回报等于这个市场的回报剩以系数加上股票残差。平均下来,理论上来说,在完美世界中,...原创 2018-04-28 10:43:40 · 1427 阅读 · 0 评论 -
用NLTK进行文本分析
句子放进去就是字符串;一、英文分词:利用空格;中文分词:启发式分词,用长度优先的方式,最长的在字典中出现的词;机器学习分词法:HMM、CRF结巴分词的GitHub主页:https://github.com/fxsjy/jieba基于python的中文分词的实现及应用:http://www.cnblogs.com/appler/archive/2012/02/02/2335834.html对pyth...原创 2018-05-14 09:58:15 · 1284 阅读 · 1 评论