前几年搞了个“钓鱼网站智能检测系统”的网站,运营了三年后下架了,效果不是很好,唯一的收获是让我体会到“做好一个产品,光靠技术是不行的”。
下面我从技术层面把产品开发过程分享下。
1、部署网站
传统的方式一般是先购买一台性能好点的服务器,放置到某个机房,然后购买公网ip,购买域名等。
现在比较主流的方式是直接购买云服务(百度,腾讯,阿里,亚马逊等)。服务器、公网ip、域名等一站式搞定。
特别需要注意的是,在中国需要给你的网站备案,备案的方法云服务商也会告诉你。
2、产品定位
这个产品主要是帮用户检测钓鱼网站。当时是作为一个独立站,其实最好的方式是以插件的方式集成到浏览器、邮件客户端等。
3、技术实现
涉及的技术点有BP神经网络,钓鱼网站样本集,web框架,网站黑白名单等。
1、BP神经网络
详细关于BP神经网络的描述,可以到网上搜索,也可以参照这里。
神经网络库比较多,本产品中使用的是pybrain。
2、钓鱼网站样本集
样本的收集工作也是比较耗时的,如下网站有收集好的钓鱼网站样本集,可以直接使用pybrain训练神经网络。这个uci