中国人工智能学会通讯——金融机构的市场机遇与实践 1.4 人工智能——系统实现关键...

1.4 人工智能——系统实现关键

最后一页是我的机器学习在金融科技中的实践体会。人工智能在书本里有比较清楚的定义,但是在工程中,这个定义就变得非常模糊和难以把握。我这里讲最基本的四个步骤:数据处理、特征提取、模型训练和评价测试。

image

工程的数据处理中,很多时候删除样本比增加样本更加重要。今天谭院士讲人工智能不是万能的,最关键的是把技术边界做好,能做的做,不能做的投降,这样最后系统的准确率和稳定性就提高了。但是数据删除,也就是挑选数据或者是过滤数据,好比是在数据中砍几刀。我们认为能够正确砍出这几刀的人,在公司的价值是非常大的,目的就是划定技术边界。

第二个就是特征提取,要对交易的本质非常清楚。

第三个是模型训练。进入模型训练很麻烦,做过搜索和推荐的都知道,最大的痛苦就是天真地相信了这份数据,然后训练出一个模型,后来发现,开始认为对的数据,实际上是不那么好的模型serve出来的,这是一个循环。

最后,评价是最重要的。如果你评价做不好,整个方向就错了,你越努力就越错得厉害。例如两位老师讲的Explore&Exploit,评价非常难,如果数据集不够,评价就没法儿做。

在金融行业里,我们目前和中国顶级的金融客户在合作。在合作的过程中,我们也遇到了很多的问题。首先就是数据的问题。传统的软件和客户是怎样合作的?传统软件开发,只要有一个小的样本数据、有非常清楚的产品需求就可以做了。但是在大数据人工智能时代,由于金融行业的特殊性,客户不会实现给你数据,但是,对于机器学习来说,只有拿到数据一切才刚刚开始,大量的工作会在数据预处理环节。反过来,你还没开始时,用户为什么让你进场拿数据?这不就是一个死结吗?这是非常大的挑战,我们有一个很好的优势,就是有这么多的模拟数据和自有交易数据,我可以先“闭门造车”搞出模型和系统,八九不离十,到客户那儿再调一下,这样就可以快速地切入进去。

(本报告根据速记整理)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值