- 博客(9)
- 收藏
- 关注
原创 机器学习笔记(1)——决策树
机器学习中分类和预测算法的评估:准确率速度强壮性可规模型可解释性 决策树决策树是一个类似于流程图的结构节点表示判断,将连续变量离散化,规定阈值归类信息熵:变量的的不确定性越大,熵也就越大 计算公式:P(x)为单个事件的概率决策树归纳算法(ID3)选择属性判断结点 信息获取量(Information Gain):Gain(A
2017-07-30 17:18:43 470
转载 python_jieba分词的使用
# coding: utf-8# ###jieba特性介绍# 支持三种分词模式:# 精确模式,试图将句子最精确地切开,适合文本分析;# 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;# 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。# 支持繁体分词。# 支持自定义词典。# MIT 授权协议。# ###分词...
2017-07-29 14:18:36 512
原创 “智能问诊”项目——数据处理(2)
这篇博客主要记录项目开发过程中遇到的两个问题第一个问题是由于之前发现Python直接对数据库进行修改时受网络情况影响大,导致效率低下,所以改用本地Excel进行分词以及数据清洗的操作,这样明显比之前的效率高了不少,但是由于电脑本身的性能限制,仍然有些不理想,但已经比原来好很多了之前对Excel进行操作主要用到了xlwt模块,这个模块主要功能是向Excel导入数据,而如果要实现本地分
2017-07-28 16:56:48 1451
原创 “智能问诊”项目——数据处理(1)
经过之前一周的工作,我已经成功的把网站上的数据爬取下来并保存到了数据库中,接下来就要对爬取到的数据进行处理了。首先,由于我们爬取到的数据都是自然语言,比如适应症的描述都是类似于“用于冠动脉粥样硬化心脏病的治疗”这样的,给我们进行搜索和查询带来了不少的困难,所以我们最先要做的就是分词,即将自然语言分解为一个个的词组,然后再经过筛选去除没用的词语,留下有用的作为关键词。分词通常有三种方法,一是
2017-07-25 13:32:49 2609 1
原创 “智能问诊”项目——数据获取(2)
在之前已经实现了将爬取到的信息直接打印出来,但这样是远远不够的,要对数据进行进一步的处理,就要将其存放在数据库中,我的方法是先将数据调整格式后储存在本地的Excel中,然后再由Excel导入数据库。对Excel进行操作主要用到了xlwt模块,官网下载(http://pypi.python.org/pypi/xlwt)。大致使用流程如下:1、导入模块 import
2017-07-24 09:32:42 1026
原创 “智能问诊”项目——数据获取(1)
首先确定需求:从“用药参考”上获取药品的名称、适应症等信息保存到本地,为数据处理做准备通过观察可以发现,不同药品的网址存在一定规律,即http://drugs.medlive.cn/drugref/html/2.shtml,“.shtml”前面的数字代表不同药品(按拼音顺序排列?)这里我们把药品的范围限定在西药,经过多次试验可以发现其范围区间为2到14578,也就是说这一万四千多种
2017-07-19 21:27:54 1510 2
原创 “健康保”APP主要技术实现方式
“健康保”APP主要技术实现方式sliding menu(第三方库)1、在Activity中通过SlidingMenu构造方法,直接设置侧滑菜单2、通过把Activity继承SlidingActivity a、继承SlidingActivityb、然后在onCreate中setBehindContentView(R.layout.leftmenu
2017-07-13 22:10:10 548
转载 QQ、微信、新浪微博和百度第三方登录
对于大多数的APP都有第三方登录这个功能,自己也做过几次,最近又有一个新项目用到了第三方登录,所以特意总结了一下关于第三方登录的实现,并拿出来与大家一同分享;各大开放平台注册账户获取AppKey和AppSecret Mob开放平台地址:http://www.mob.com/#/index QQ开放平台地址:http://open.qq.com/ 新浪微博开放平台地址:http:
2017-07-06 14:12:43 3055
转载 android Mediaplayer各种属性和方法简单介绍
主要涉及类:MediaPlayer (1) 当一个MediaPlayer对象被创建或者调用reset()方法之后,它处于空闲状态,调用release()方法后处于结束状态 1,一个MediaPlayer对象调用了reset()方法后,再调用其它方法可能会触发OnErrorListener.onError()事件,未调用reset()方法则不会触发 2,当Mediaplayer对象不再被
2017-07-05 16:32:33 516
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人