机器学习实战
danwuxie
这个作者很懒,什么都没留下…
展开
-
k-近邻算法
对未知类型属性的数据集中的每个点依次执行以下操作: (1)计算已知类别数据集中的点与当前点之间的距离 (2)按照距离递增次序排序 (3)选取与当前点距离最小的k个点 (4)确定前k个点所在类别的出现频率 (5)返回前k个点出现频率最高的类别作为当前点的预测分类 示例一: from numpy import * import operator group = array([[1.0,...原创 2018-11-28 21:50:08 · 122 阅读 · 0 评论 -
Python爬虫流程
爬虫基本流程 发起请求 通过HTTP库向目标服务器发送Request,Request内可以包含额外的headers信息。获取响应内容 如果服务器正常响应,会返回Response, 里面包含的就是该页面的内容。解析数据 内容或许是HTML,可以用正则表达式、网页解析库进行解析。 或许是Json,可以直接转换为Json对象解析。保存数据 可以存储为文本,也可以保存至数据库,或其他特定类型文...转载 2019-04-12 21:23:57 · 160 阅读 · 0 评论