自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 数据分析-01

import pandas as pdimport numpy as npfrom IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"# 文件目录,相对路径INPUT_PATH = './'# 文件读取行数#MAX_ROWS = 100000#数据处理#巡游车gpstaxigps2019 = pd.read_csv(INPUT_PAT.

2020-09-11 21:04:34 108

原创 DW-leetcode-04

查找21.两数之和给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。def twoSum(nums, target): lens = len(nums) j=-1 for i in range(lens): if (target - nums[i]) in nums: if (nums.count(target - nums[i]) == 1)&(t...

2020-08-28 21:51:03 146

原创 DW-DA-03

模型建立和评估import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPython.display import Image#%matplotlib inline# 不用print,直接显示结果from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_no

2020-08-28 21:19:36 92

原创 DW-ML-03

支持向量机(Support Vector Machine,SVM)支持向量机是一个非常优雅的算法,具有非常完善的数学理论,常用于数据分类,也可以用于数据的回归预测中,由于其优美的理论保证和利用核函数对于线性不可分问题的处理技巧, 在上世纪90年代左右,SVM曾红极一时。 本文将不涉及非常严格和复杂的理论知识,力求于通过直觉来感受 SVM凉了呀。...

2020-08-26 21:46:15 108

原创 2020-08-25

查找①35. 搜索插入位置给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。你可以假设数组中无重复元素。class Solution: def searchInsert(self, nums: List[int], target: int) -> int: if target < nums[0]or (len(nums) == 1 and target == nums[0]): re

2020-08-25 20:18:22 194

原创 DW-leetcode-02

动态规划5.最长回文子串给定一个字符串s,找到s中最长的回文子串。你可以假设s的最大长度为 1000。class Solution: def longestPalindrome(self, s: str) -> str: n = len(s) dp = [[False] * n for _ in range(n)] ans = "" # 枚举子串的长度 l+1 for l in ran...

2020-08-23 18:11:21 72

原创 DW-ML-02

决策树的介绍决策树是一种常见的分类模型,在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通常会先看男方是否有房产,如果有房产再看是否有车产,如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。决策树的主要优点:具有很好的解释性,模型可以生成可以理解的规则。 可以发现特征的重要程度。 模型的计算复杂度较低。决策树的主要缺点:模型容易过拟合,需要采用减枝技术处理。 不能很

2020-08-22 22:24:36 137

原创 DW-DA-02

数据清洗与重构#加载所需的库import numpy as npimport pandas as pdfrom sklearn.preprocessing import LabelEncoder#加载数据train.csvdf = pd.read_csv('train.csv')df.head(3)#我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,#需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失.

2020-08-21 21:41:23 139

原创 DW-ML-01

逻辑回归的应用逻辑回归模型广泛用于各个领域,包括机器学习,大多数医学领域和社会科学。例如,最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分析预测发生特定疾病(例如糖尿病,冠心病)的风险。逻辑回归模型也用于预测在给定的过程中,系统或产品的故障的可能性。还用于市场营销应用程序,例如预测客户购买产品或中止订购的倾向等。在经济学中它可以用来预测一个人选择进入劳动力市场的可能性,而商业应用

2020-08-19 20:30:56 157

原创 DW-DA-01

numpy和pandas一些操作import numpyimport pandas as pd# 不用print,直接显示结果from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"# 显示所有列pd.set_option('display.max_columns', 600)#第一节#1载入数据# 相对路径载入df = .

2020-08-19 17:26:53 150

原创 DW-leetcode-01

分治算法(divide and conquer)分治算法的基本思想是将一个规模为N的问题分解为K个规模较小的子问题,这些子问题相互独立且与原问题性质相同。求出子问题的解,就可得到原问题的解。即一种分目标完成程序算法,简单问题可用二分法完成。分治法解题的一般步骤:(1)分解,将要解决的问题划分成若干规模较小的同类问题;(2)求解,当子问题划分得足够小时,用较简单的方法解决;(3)合并,按原问题的要求,将子问题的解逐层合并构成原问题的解。与递归的区别递归的逻辑中有两个重要的概.

2020-08-18 23:07:26 124

转载 【转】图灵机与计算问题(张江)

学图灵机学到哭泣,为我贫乏的大脑默哀……贴一点看到的好文章吧……quote from: http://www.blog.edu.cn/user1/5897/archives/2005/330298.shtml自从20世纪30年代以来,图灵机、计算这些重要的概念在科学的天空中就一直闪烁着无限的光彩。尤其是近年来量子计算机、生物计算机、DNA计算等领域的创新工作引起了世人的广泛关注。我们不禁问...

2018-11-15 20:38:54 1186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除