王庆鑫
码龄10年
关注
提问 私信
  • 博客:12,282
    12,282
    总访问量
  • 1
    原创
  • 572,367
    排名
  • 4
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2014-12-28
博客简介:

wqx1414161394的博客

查看详细资料
个人成就
  • 获得3次点赞
  • 内容获得2次评论
  • 获得14次收藏
创作历程
  • 4篇
    2018年
TA的专栏
  • python
    2篇
  • 分词
    1篇
  • sql
    1篇
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python逻辑回归代码实例

# -*- coding: utf-8 -*-"""Created on Tue Feb 6 09:00:31 2018@author: wangqingxin"""import pandas as pdfrom pandas.core import datetoolsimport statsmodels.api as smimport pylab as plimport n...
原创
发布博客 2018.03.01 ·
1019 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

impala调优

Impala是Cloudera开发、开源的一个原生于Hadoop的交互式SQL引擎。本身Impala的出现并不是为了替代Hive、Pig等现有的、常用的ETL工具。实用的场景往往于商业智能密不可分,比如对数据进行聚合(Aggregation)、做一些简单的分析统计(比如window function),通过JDBC/ODBC,集成到当今流行的BI工具中,例如Tableau等等。这篇博文主要来探讨下...
转载
发布博客 2018.03.01 ·
660 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python+条件随机场(crf)+词性标注

      本文运用字标注法进行中文分词,使用4-tag对语料进行字标注,观察分词效果。模型方面选用开源的条件随机场工具包“CRF++: Yet Another CRF toolkit”进行分词。        本文使用的中文语料资源是SIGHAN提供的backoff 2005语料,目前封闭测试最好的结果是4-tag+CFR标注分词,在北大语料库上可以在准确率,召回率以及F值上达到92%以上的效...
转载
发布博客 2018.03.01 ·
10322 阅读 ·
3 点赞 ·
2 评论 ·
20 收藏

基于Python的机器学习实战:AadBoost

目录:1. Boosting方法的简介2. AdaBoost算法3.基于单层决策树构建弱分类器4.完整的AdaBoost的算法实现5.总结1. Boosting方法的简介 返回目录Boosting方法的基本思想:对于一个复杂的任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家单独的判断好. 实际上就是“三个臭皮匠顶个诸葛亮的道理。”(参考:李航 《统计学习方法》)对于分类问...
转载
发布博客 2018.03.01 ·
268 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏