自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 用朴素贝叶斯完成语种检测(外文)

我们试试用朴素贝叶斯完成一个语种检测的分类器,说起来,用朴素贝叶斯完成这个任务,其实准确度还不错的我们拉一些twitter上的数据(data.csv),包括六种语言file = open('C:/Users/laoGong/Desktop/data.csv')lines = file.readlines()file.close()我们现在查看一下数据lines[:5]...

2018-08-22 19:47:07 748

原创 机器学习中的评估指标

一.  机器学习的目标什么模型好??  泛化能力强!!!能很好的适用于没见过的样本。例如  错误率低  精度高我们手上没有未知的样本,如何可靠评估??关键:获得可靠的测试集数据?测试集(用于评估)应该与训练集(用于模型学习)"互斥"二. 机器学习的评估方法1.留出法注意:1.测试集不能太大,不能太小2.多次重复划分3.保持数据分布一致性2.自...

2018-07-26 16:19:21 316

原创 机器学习基本流程与工作环节

一. 机器学习应用几大环节机器学习的应用工作是围绕着数据和算法展开的二. 机器学习的不同阶段和作用1.数据预处理输入:未处理的数据 + 标签处理过程:特征处理+幅度缩放——>特征选择——>维度约减——>采样得到 测试集 + 训练集2.模型学习   模型选择——>交叉验证——>结果评估——>超参选择3.模型评估    了解模...

2018-07-26 15:34:26 2424

原创 机器学习基本概念

一. 不同类型的问题监督学习(特征 + 标签)分类问题:根据数据样本上抽取出的特征,判断其属于有限个类别中的哪一个eg: 垃圾邮件识别(结果类别:1 垃圾邮件 2 正常邮件)      文本情感褒贬分析(结果类别:1 褒  2 贬)      图像内容识别(结果类别:1 喵星人  2  汪星人  3  人类  4  曹尼玛  5 都不是)回归问题:根据数据样本上抽取出的...

2018-07-26 15:10:48 175

原创 机器学习概述

一. 机器学习是什么??人工智能的一个重要学科 分支多领域交叉学科 数据驱动 在数据上通过算法总结规律模式,应用在新数据上如图,机器学习包括  业务 + 数学/统计 + 编程与数据挖掘,模式识别,统计,广义AI等均有涉及交叉与应用机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识和技能,并重新组织已有的知识结构是指不断改善自身。就是计算机从数据中学习出规律...

2018-07-26 10:25:55 216

原创 时间(time) python

python标准模块  —— time时间模块1.time.ctime()将当前时间打印为字符串import timeprint(time.ctime(),type(time.ctime()))#Mon Apr 30 15:35:48 2018 <class 'str'>2.time.sleep(a) 程序休息a秒运行for i in range(10): print('h...

2018-04-30 15:52:20 329

原创 随机数(random) python

python标准模块  ——   random随机数1.random.random()  生成一个[0,1)的随机数import randomprint(random.random(),random.random()*10) #0.9924202460687734 5.1365652923283322.random.randint(a,b)   生成一个[a,b]的随机整数print(ra...

2018-04-30 15:24:30 185

原创 字典详解(Python)

1.字典dict的基本概念字典是另一种可变容器模型,且可存储任意类型对象字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用(,)分割,整个字典包括在花括号({})中键必须是唯一的,但值不必dic = {'大头儿子':6, '小头爸爸': 35, '隔壁老王':37}print(dic,type(dic)){'小头爸爸': 35, '隔壁老王': 37, '大头儿子': ...

2018-04-22 07:30:06 932

原创 注释(Python)

注释是用来说明代码程序运行的时候,Python解释器会直接忽略掉注释 → 有没有注释不影响程序的执行结果,但是影响到别人能不能看懂你的代码。但“#”不只代表注释,还代表某些文件的特殊格式,写在脚本开头注意:注释只在脚本中起作用print('hello world!')# print('I love python')hello world!注释也可以用来标记暂时不会运行的语句a = [1,2,3...

2018-04-21 11:23:56 174

原创 运算符(Python)

什么是运算符?——1 + 2 = 3  的例子中, 1 和 2 被称为操作数,“+”被称为运算符算数运算符x,y = 4,5value = x + y print("x + y = ",value)value = x - y print("x - y = ",value)value = x * y print("x * y = ",value)value = x / y prin...

2018-04-21 11:12:45 134

原创 认识变量(Python)

1.  什么是变量     ——方程式“=”左边的,就是变量给变量赋值即创建该变量,并且同时赋予该变量变量名变量类型等号(=)用来给变量赋值变量命名规则变量名第一个字符必须是字母(大小写均可)或者下划线(“_”),不能数字开头变量名不能和常用功能性名字重合,丽日print,if,for不能有空格2.变量赋值:单一变量赋值:counter = 100 #赋值整形变量miles = 1000.0 #浮...

2018-04-21 10:41:44 127

原创 int,float,str数据类型转换

int(x)函数:将x转换成整数,是向下转型var1 = 5.2var2 = 5.5var3 = 5.9print(var1,var2,var3,type(var1))print(int(var1),int(var2),int(var3),type(int(var3)))5.2 5.5 5.9 <class 'float'>5 5 5 <class 'int'>...

2018-04-21 09:20:14 5190

原创 Python基本类型介绍

Python标准数据类型:Numbers数字,String字符串,List列表,Tuple元祖,Dict字典Numbers数字:int整型,long长整型,float浮点型,complex复数a1 = 5a2 = 5.5print(a1,type(a1))print(a2,type(a2))5 <class 'int'>5.5 <class 'float'>Str...

2018-04-21 09:04:42 160

原创 Jupyter Notebook使用简析

1. 为什么要使用Jupyter Notebook: 方便代码共享导出多种文件类型通过email,Dropbox,Github分享交互式部件丰富的输出,如图像,视频,LaTex, JavaScript交互式小部件可以用来实时操作和可视化数据大数据整合支持大数据工具,如Apache Spark,from Python,R and Scala方便pandas,scikit-learn,ggplot2,...

2018-04-21 08:21:16 1493

原创 集成开发环境及Python运行逻辑

1.什么是集成开发环境(IDE):IDE(Integrated Development Envronment): 是一个用于提供程序开发环境的应用程序一般包括代码编辑器,编译器,调试器和图形用户界面等工具  Python的IDEIDLE PycharmAnacondaNotepadSublimeIDLE:IDLE是一个纯Python下的相当基本的IDEAnaconda:Anaconda可以看做Py...

2018-04-20 22:42:05 671

原创 为什么用python进行数据分析

1.数据分析有哪些技术平台:非编程类:STATA,SPSS,MATLAB等编程类:python,R等(自由性更高,可以自己组装函数模块)2.数据分析师都干什么:数据挖掘(数据工程师,数据科学家)数据库处理报告/文案数据可视化(可视化工程师)3.数据分析要求:强逻辑  数理思维自由  灵活“码农化”4.为什么选择python:Python设计哲学:用一种方法,最好是只有一种方法来做一件事通过impo...

2018-04-20 21:15:06 860

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除