自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(59)
  • 资源 (5)
  • 收藏
  • 关注

原创 深入浅出统计学(十五)相关与回归及PYTHON实现

基本概念PYTHON实现数据 # 求平均数def list_mean(l): sum=0 for i in l: sum+=i return sum/len(l) # 计算b值def cal_b(l1,l2): x1=list_mean(l1) y1=list_mean(l2) sum1=0 ...

2018-07-31 19:17:33 491

原创 PYTHON编程导论群问题汇总(五)

Q15.改变对象与绑定P54:Univs和Univs1被绑定到不同的对象的原理不是很清楚。bigjing: Univs = [Techs, Ivys]Univs1 = [['MIT', 'Caltech'], ['Harvard', 'Yale', 'Brown']] Univs绑定的是含有Techs和Ivys的列表。Univs1绑定的是含有['MIT', 'Calt...

2018-07-29 23:26:09 639

原创 PYTHON编程导论群问题汇总(四)

Q6. 函数局部变量赋值问题P37:“print语句后面的赋值语句使x成为函数g中的局部变量执行print语句时还没有被赋值。”报错的原因不是很理解~bigjing: 在回答这个问题前,我们先理解一个规则:【全局变量和局部变量同名的时候,局部变量优先】或者说【近的优先】,同理,父类和子类有同名的属性或方法时,子类优先,也就是说先调用子类的,子类没有,再向上调用父类的。 回到正...

2018-07-29 23:10:45 600

原创 PYTHON编程导论群问题汇总(三)

Q1: week2-3, Ex-guess my number在做week2练习:guess my number时遇到一个小问题。代码已经写好,结果也和给出的答案一样,但是格式有一点不同,如下:# 这是我的outputPlease think of a number between 0 and 100!Is your secret number 50?Enter 'h' t...

2018-07-29 22:56:56 861

原创 计算机科学和Python编程导论(六) 测试与调试

基本概念测试指通过运行程序以确定它是否按照预期工作。调试则指修复已知的未按预期工作的程序。测试和调试的关键就是将程序分解成独立的部件,可以在不受其他部件影响的情况下实现、测试和调试。关于测试,最重要的是清楚它的目的是证明错误的存在,而不是证明程序没有错误。测试的关键就是找到极有可能产生错误答案的一组输入,可以称之为测试套件找到测试套件的关键是,对所有可能的输入空间进行分区,...

2018-07-27 17:18:33 689

原创 机器学习、数据挖掘、数据分析岗面试总结

算法面试注意细节算法工程师岗位(机器学习、数据挖掘、数据分析等)面试主要包含两大块:首先是基本的 Coding 能力;其次就是机器学习算法的理论与应用能力。基本的 Coding 能力考察,主要是让你写一些数据结构与算法设计的常见算法题,比如链表类、二叉树、排序、查找、动态规划等。这方面建议《剑指 Offer》+ LeetCode 结合的方式进行练习。机器学习算法理论与应用能力不用说,应...

2018-07-25 23:53:02 13857 4

原创 PYTHON编程导论群【提问与解惑】数据统计

1. 代码实现import matplotlib.pyplot as pltimport seaborn as snsplt.rcParams['font.family'] = ['SimHei'] # Microsoft YaHeiplt.rcParams['axes.unicode_minus'] = False %matplotlib inlinethinker = ['J...

2018-07-24 16:45:20 577

原创 PYTHON编程导论群问题汇总(二)

问题1[lmz]为什么说计算机储存整数(int)是精确的而储存小数(float)则是不精确的? Aris 我举2个例子, 还原计算机如何表示 0.625, 0.1 问题2[lmz]Guess and Check methods中,产生guess的有:Exhaustive Enumeration 穷举法Bisection search 二分法Newton-Ra...

2018-07-24 15:17:26 710

原创 PYTHON编程导论群问题汇总(一)

问题1[Jane]课程视频用的是python 2.7并推荐了一个软件可是书上用的是python 3所以是安装视频推荐的软件来学习还是用自己的python 3好呢Bigjing 推荐python3考虑到python2终究被淘汰 以python3为主更适合后期的学习lmz edx是py3, 学堂在线是py2(老版本) 如果能看得进全英文,建议看edx的新版 另外可以用an...

2018-07-24 14:20:33 833

原创 数据统计脚本(汇总)

1. 注册数量;提交借款申请select count(*) from agentCore.custInfo where channelid=393 and datediff(registertime,'2018-07-22')<=0; #贷款平台select count(*) from agentCore.loanCase where channelid=393 and dat...

2018-07-23 20:52:00 2258

原创 数据统计脚本(一周)

1. 注册数量;提交借款申请select count(*) from agentCore.custInfo where channelid=393 and datediff(registertime,'2018-07-16')>=0 and datediff(registertime,'2018-07-22')<=0; select count(*) from agentCo...

2018-07-23 20:49:20 1078

原创 【python编程导论】我想和你探讨下如何去写好程序

1. 题目来源麻省理工的编程导论: Introduction to Computer Science and Programming Using Python 第一周课程的第三个编程题 Week 1: Python Basics Problem Set 1 Problem 32. 题目内容Assume s is a string of lower case charact...

2018-07-20 17:31:48 778

原创 番茄钟工作法:你真的了解番茄钟么?

核心内容什么是番茄工作法;如何执行番茄工作法;番茄工作法的原理与适用范围。1. 什么是番茄工作法番茄工作法的发明者 意大利人弗朗西斯科·西里洛于1992年创立了番茄工作法。他和我们大多数人一样,是一个重度拖延症患者。他在大学生活的头几年,曾一度苦于学习效率低下,于是他做了个简单的实验:我就不信我不能专注10分钟。他找来形状像番茄的厨房定时器,调到10分钟来督促自己专注。...

2018-07-18 20:44:05 24544 4

原创 计算机科学和Python编程导论(三) 一些简单的数值程序

基本概念1. 穷举法穷举法:是猜测与检验算法的一个变种。我们枚举所有可能性,直至得到正确答案或者尝试完所有值。#寻找完全立方数的立方根x = int(input('Enter an integer: '))ans = 0while ans**3 < abs(x): ans = ans + 1if ans**3 != abs(x): print(x, '...

2018-07-16 20:38:32 2301 2

原创 计算机科学和Python编程导论(二 ) Python简介

基本概念1. 编程语言的分类低级编程与高级编程:二者之间的区别是,编写程序时,我们是使用机器层次的指令和数据对象(底层操作),还是使用语言设计者提供的更为抽象的操作(图形用户界面,UI)。通用性与专注于某一应用领域:指编程语言中的基本操作是广泛适用的还是只针对某个领域,例如SQL。解释运行与编译运行:指程序员编写的指令序列,即源代码是直接执行(通过解释器,使用解释型语言编写的程序更...

2018-07-16 20:38:20 2062

原创 计算机科学和Python编程导论(一) 计算机相关理论

基本概念1. 计算机基础知识陈述性知识:关于事实的描述。如果满足y × y = x,那么x的平方根就是数值y。程序性知识:说明“如何做”,描述的是信息演绎的过程。算法:是一个有穷指令序列,它在给定的输入集合中执行时,会按照一系列定义明确的状态进行,并最终产生一个输出结果。解释器:可以执行任意合法指令集的程序(这样计算机就能够计算任何可以使用基本指令集描述的问题。)计算机...

2018-07-16 20:38:08 879

原创 【pandas学习笔记】综合整理

1. ReindexSeries Reindex import numpy as npimport pandas as pd>>>s1 = pd.Series(np.random.randn(1, 4).tolist()[0], index=['A', 'B','C','D']) #先将数组转成listA 0.523862B -0.341507C...

2018-07-13 19:59:02 706

原创 【pandas学习笔记】DataFrame

1. 创建DataFrame可以通过以下方式进行创建 1. list 2. dictionary 3. ndarrays 4. 2d ndnarrays等通过dictionary key默认为列名# 索引自动添加df = pd.DataFrame({'Student_1':[90,100, 95], 'Student_2':[60, 80, 100]})# 索引主动...

2018-07-12 15:41:05 940

原创 【pandas学习笔记】Series

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inline创建Series以及对Series的相关操作# 自动添加索引# np.nan:empty value>>>s1 = pd.Series([1,2,3,4,np.nan,5,6,7]) 0 ...

2018-07-12 11:20:45 709

原创 【numpy学习笔记】数组的存储和下载

1. Saving array in binary format (.npy)>>>a = np.array([1,2,3,4,5])>>>np.save('array_a',a)>>>np.load('array_a.npy')a

2018-07-11 20:45:31 581

原创 【numpy学习笔记】 Array processing

1. numpy where function>>>A = np.array([1,2,3,4])>>>B= np.array([5,1,7,2])>>>condition = np.array([True,False,False,False])>>>np.where(condition,A,B)array([...

2018-07-11 17:45:08 751

原创 【numpy学习笔记】矩阵操作

转置a = np.array([[1,2,3],[3,4,5]],dtype='float')# array([[ 1., 2., 3.], [ 3., 4., 5.]])a.T # array([[ 1., 3.], [ 2., 4.], [ 3., 5.]])a = np.array([[[1,2,3,0],[...

2018-07-11 17:25:49 1253 1

原创 【numpy学习笔记】数组的切片,索引,迭代

1. 一维数组切片a = np.arange(10)# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])a[5]# 5a[2:6] # array([2, 3, 4, 5])a[0:3] = 100a # 原数组发生改变array([100, 100, 100, 3, 4, 5, 6, 7, 8, 9])# ...

2018-07-10 20:34:25 800

原创 【numpy学习笔记】数组的创建和基本运算

1. 创建numpy数组1.1 通过tuple和list创建数组import numpy as np通过tuplet=(1,2,3)a=np.array(t,dtype= 'int')#array([1, 2, 3])通过listlist1 = [1,2,3]a = np.array(list1,dtype='int')#array([1, 2, 3])用多个...

2018-07-10 17:49:43 1252

原创 【廖雪峰python进阶笔记】定制类

1. __str__和__repr__如果要把一个类的实例变成 str,就需要实现特殊方法__str__():class Person(object): def __init__(self, name, gender): self.name = name self.gender = gender def __str__(self): ...

2018-07-10 15:21:28 3927 1

原创 【廖雪峰python进阶笔记】类的继承

1. 继承如果已经定义了Person类,需要定义新的Student和Teacher类时,可以直接从Person类继承:class Person(object): def __init__(self, name, gender): self.name = name self.gender = gender定义Student类时,只需要把额外的属...

2018-07-10 09:50:05 2621

原创 【廖雪峰python进阶笔记】面向对象编程

1. 定义类并创建实例在Python中,类通过 class 关键字定义。以 Person 为例,定义一个Person类如下:class Person(object): pass按照 Python 的编程习惯,类名以大写字母开头,紧接着是(object),表示该类是从哪个类继承下来的。类的继承将在后面的章节讲解,现在我们只需要简单地从object类继承。有了Person类...

2018-07-09 18:07:07 3125

原创 【廖雪峰python进阶笔记】模块

1. 导入模块要使用一个模块,我们必须首先导入该模块。Python使用import语句导入一个模块。例如,导入系统自带的模块 math: import math你可以认为math就是一个指向已导入模块的变量,通过该变量,我们可以访问math模块中所定义的所有公开的函数、变量和类:>>> math.pow(2, 0.5) # pow是函数1.414213562373...

2018-07-09 16:01:00 2335

原创 【廖雪峰python进阶笔记】函数式编程

1. 高阶函数高阶函数就是可以把函数作为参数的函数,下面我们看一个简单的高阶函数:def add(x, y, f): return f(x) + f(y)如果传入abs作为参数f的值:add(-5, 9, abs)根据函数的定义,函数执行的代码实际上是:abs(-5) + abs(9)由于参数 x, y 和 f 都可以任意传入,如果 f 传入其他函数...

2018-07-09 15:15:30 8429 4

原创 【廖雪峰python入门笔记】列表生成式

1. 生成列表要生成list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],我们可以用range(1, 11):>>> range(1, 11)[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]但如果要生成[1x1, 2x2, 3x3, …, 10x10]怎么做?方法一是循环:>>> L = []>

2018-07-07 10:31:17 4761 1

原创 【廖雪峰python入门笔记】迭代

1. 迭代在Python中,如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们成为迭代(Iteration)。在Python中,迭代是通过for ... in来完成的,而很多语言比如C或者Java,迭代list是通过下标完成的,比如Java代码:for (i=0; i<list.length; i++) { n = lis...

2018-07-07 10:30:37 2433

原创 【廖雪峰python入门笔记】切片

1. 对list进行切片对list进行切片 取一个list的部分元素是非常常见的操作。比如,一个list如下:L = ['Adam', 'Lisa', 'Bart', 'Paul']取前3个元素,应该怎么做?笨办法:>>> [L[0], L[1], L[2]]['Adam', 'Lisa', 'Bart']之所以是笨办法是因为扩展一下,取前N个...

2018-07-07 10:30:31 1958

原创 【廖雪峰python入门笔记】函数

1. 函数我们知道圆的面积计算公式为:S = πr²当我们知道半径r的值时,就可以根据公式计算出面积。假设我们需要计算3个不同大小的圆的面积:r1 = 12.34r2 = 9.08r3 = 73.1s1 = 3.14 * r1 * r1s2 = 3.14 * r2 * r2s3 = 3.14 * r3 * r3当代码出现有规律的重复的时候,你就需要当心了,每次...

2018-07-07 10:30:23 2616

原创 【廖雪峰python入门笔记】set

1. setdict的作用是建立一组 key 和一组 value 的映射关系,dict的key是不能重复的。有的时候,我们只想要 dict 的 key,不关心 key 对应的 value,目的就是保证这个集合的元素不会重复,这时,set就派上用场了。set 持有一系列元素,这一点和 list 很像,但是set的元素没有重复,而且是无序的,这点和 dict 的 key很像。创建 se...

2018-07-07 10:30:16 2493

原创 【廖雪峰python入门笔记】dict

1. dict我们已经知道,list和tuple 可以用来表示顺序集合,例如,班里同学的名字:['Adam', 'Lisa', 'Bart']或者考试的成绩列表:[95, 85, 59]但是,要根据名字找到对应的成绩,用两个 list 表示就不方便。如果把名字和分数关联起来,组成类似的查找表:'Adam' ==> 95'Lisa' ==> 85'Bart...

2018-07-07 10:29:51 2548 1

原创 【廖雪峰python入门笔记】多重循环

在循环内部,还可以嵌套循环,我们来看一个例子:for x in ['A', 'B', 'C']: for y in ['1', '2', '3']: print(x + y)x 每循环一次,y 就会循环 3 次,这样,我们可以打印出一个全排列:A1 A2 A3 B1 B2 B3 C1 C2 C3...

2018-07-06 09:16:30 1862

原创 【廖雪峰python入门笔记】break和continue

用 for 循环或者 while 循环时,如果要在循环体内直接退出循环,可以使用 break 语句。比如计算1至100的整数和,我们用while来实现:sum = 0x = 1while True: sum = sum + x x = x + 1 if x > 100: breakprint(sum)咋一看, while True 就...

2018-07-06 09:16:23 2092

原创 【廖雪峰python入门笔记】while循环

和 for 循环不同的另一种循环是while 循环,while 循环不会迭代 list 或 tuple 的元素,而是根据表达式判断循环是否结束。比如要从 0 开始打印不大于 N 的整数:N = 10x = 0while x < N: print(x) x = x + 1while循环每次先判断 x < N,如果为True,则执行循环体的代码块,否则,退出...

2018-07-06 09:16:13 2374

原创 【廖雪峰python入门笔记】for循环

list或tuple可以表示一个有序集合。如果我们想依次访问一个list中的每一个元素呢?比如 list:L = ['Adam', 'Lisa', 'Bart']print(L[0])print(L[1])print(L[2])如果list只包含几个元素,这样写还行,如果list包含1万个元素,我们就不可能写1万行print。这时,循环就派上用场了。Python的 for...

2018-07-06 09:16:07 2243

原创 【廖雪峰python入门笔记】if语句

1. if语句及缩进规则计算机之所以能做很多自动化的任务,因为它可以自己做条件判断。比如,输入用户年龄,根据年龄打印不同的内容,在Python程序中,可以用if语句实现:age = 20if age >= 18: print('your age is', age) print('adult')print('END')注意: Python代码的缩进规则。具有...

2018-07-06 09:15:54 2451

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除