xutiantian1412的博客

不要总想搞个大项目

python数据结构与算法系列文章汇总(持续更新。。)

虽然是用python搞机器学习的大项目,还是要从零开始学习数据结构那一套理论。不知不觉数据结构及算法系列的学习及LeetCode刷题已经一大堆,现对此汇总。 1)数据结构与算法的理论,从线性表开始(链表,栈和队列),然后是数组和字符串的初级理论和题目,包括双指针,二分查找。 2)接下来打算学习...

2018-10-02 22:29:10

阅读数 163

评论数 0

数据挖掘实战之天池精准医疗大赛(2)——算法思路

Part 1-2 算法思路:下面我们根据前文对数据集的认识,分析问题和解题思路。其实讲述算法思路是一件十分复杂和困难的事儿,按照自上向下的顺序结合一位大佬的文章,谈一谈:一,说到思路,其实就是数据、特征、模型三个部分,数据预处理服务于特征工程,特征服务于模型,又决定了模型的上限。这三部分密不可分,...

2018-02-09 16:13:36

阅读数 1174

评论数 0

数据挖掘实战之天池精准医疗大赛(1)——赛题与数据

首先介绍题目与数据:特别提供一下数据,供后来看到的盆友下载研究(现在官网上剩下的数据是复赛的了),测试数据分AB榜,不了解的去看天池平台的介绍:链接:https://pan.baidu.com/s/1SGZi_o1UVobHfy275onoOw 密码:rf6s竞赛题目中国是世界上糖尿病患者最多的国...

2018-02-05 15:35:44

阅读数 2699

评论数 7

正则表达式知识汇总

正则表达式(Regular Expression)是文本处理中的基本功,是做一名自然语言处理工作者的必备技能。本文主要在了解、应用过正则的基础上,进一步提升,深入学习的指导。 正则表达式是处理字符串的强大工具,拥有独特的语法和独立的处理引擎。 我们在大文本中匹配字符串时,有些情况用str自带的...

2019-02-14 09:18:49

阅读数 46

评论数 0

浅谈机器学习从入门到进阶

知识体系完整科班出身的在校生及诸位大神请跳过此篇。。。 作为一位半路出家(当然不是削发为僧,不过既然要当程序员,头发也是留不住的)没有科班经历,想涉足机器学习这摊浑水的,可以参考一下这份人生经验。 鄙人作为一位从地质勘探行业(从几百米的井下)走出的青年失业研究生,自己探索自学ML这条不归路已一...

2018-12-31 16:28:21

阅读数 65

评论数 0

1.6 python数据结构之双向链表/循环链表——以OrderedDict数据结构为例

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/bell10027/article/details/80940260 OrderedDict 是 collections 提...

2018-12-23 17:31:16

阅读数 30

评论数 0

6.1 查找算法概述

一、基本概念 查找是在大量的信息中寻找一个特定的信息元素,在计算机应用中,查找是常用的基本运算。 被查找的对象是由一组记录组成的表或文件,而每个记录则由若干个数据项组成,并假设每个记录都有一个能唯一标识该记录的关键字。在这种条件下,查找的定义是:给定一个值k,在含有n个记录的表中找出关键字等于...

2018-12-23 16:05:11

阅读数 44

评论数 0

4.4.3 python 字符串双指针/哈希算法3 —— Minimum Window Substring & Smallest Range

这一节两道题颇有难度,hard层次的, 可谓需要对双指针和哈希二者理解十分透彻,当然了,一些特定的处理技巧也是很重要的。这两道题比较思想比较接近,建议认真研读,弄清这一类问题。 76. Minimum Window Substring Given a string S and a string...

2018-12-15 23:43:11

阅读数 32

评论数 0

Java中文NLP工具汇总

NLP任务都是要用python完成么?当然不是了。。。毕竟企业级服务还是Java性能好。下面介绍几个可供选择的中文NLP任务工具包。 首先声明,本文介绍的所有工具也可参考下文: Java开源项目cws_evaluation:中文分词器分词效果评估对比 文中比较了10个中文分词工具,比较了他们...

2018-12-11 20:00:17

阅读数 136

评论数 0

5.1 python数据结构与算法之算法思想概述

常见的算法思想概述: 这一章开始介绍算法知识, 为后面的学习奠定基础,除了下一节要介绍的递归外,后面还将详细介绍 动态规划, 贪心等思想, 更重要的是,后续查找,排序等常见算法中,均要涉及到这些基础的算法思想。 算法的英文名称是Algorithm,这个词在1957年之前在Webster’s N...

2018-11-30 20:19:42

阅读数 34

评论数 0

4.4.2 python 字符串双指针/哈希算法2 —— Substring with Concatenation of All Words & Group Anagrams

这两道题目都很巧妙的应用了哈希算法,可以作为哈希算法的应用讲解,后面介绍哈希的时候就不再做题了哈。 30. Substring with Concatenation of All Words You are given a string, s, and a list of words, words...

2018-11-24 11:42:04

阅读数 31

评论数 0

4.4.1 python 字符串双指针/哈希算法1—— Reverse Vowels of a String & Longest Substring Without Repeating Char

这一部分开始,我们应用双指针及哈希等常见的简单的算法,解决一些字符串的难题。 345. Reverse Vowels of a String Write a function that takes a string as input and reverse only the vowels of...

2018-11-13 00:02:58

阅读数 30

评论数 0

4.3 LeetCode字符串题目选做之回文——Valid Palindrome & Shortest Palindrome

就字符串回文的几道题,看看这类问题的解决方案。 125. Valid Palindrome Given a string, determine if it is a palindrome, considering only alphanumeric characters and ignorin...

2018-11-12 00:07:10

阅读数 30

评论数 0

Java泛型详解

Java泛型是Java基础知识的重要内容,现摘抄一些看到的博客的讲解,算作自己学习的笔记。 java 泛型详解-绝对是对泛型方法讲解最详细的,没有之一 该博客的作者还参考了: java泛型详解,Java1.5泛型指南中文版(Java1.5 Generic Tutorial)   1. 概述...

2018-11-04 17:30:16

阅读数 44

评论数 0

5.2 递归算法及设计思想

这一章节比较简单,就归纳总结一下递归的思想。 0 定义及内涵 这一思想应该是简单而重要的一种算法思想,所以我们也最先介绍一下其思想和应用。可以参考博客的介绍:https://blog.csdn.net/sinat_38052999/article/details/73303111 还有知乎一...

2018-10-22 00:11:58

阅读数 75

评论数 0

4.2.3 LeetCode字符串类题目选做(3) —— String to Integer (atoi) & Integer to English Words

这一节是关于字符串和数字的解析的两个题目,往往要求我们不要用内置的类型转换函数。 8. String to Integer (atoi) Implement atoi which converts a string to an integer. 具体要求简述:字符串开始可以有多个空格,然后是...

2018-10-13 12:02:42

阅读数 28

评论数 0

4.2.2 LeetCode字符串类题目选做(2)—— Length of Last Word & Reverse Words in a String

这一节也是对字符串的一些简单处理,而且都是处理word,难度都不大,做一做这类题有点像NLP工程师。 58. Length of Last Word Given a string s consists of upper/lower-case alphabets and empty space ...

2018-10-07 22:28:01

阅读数 40

评论数 0

4.2.1 LeetCode字符串类题目选做(1) —— Roman to Integer & Text Justification

字符串的题目,首先是一些简单的字符串处理的问题,不涉及到什么算法。关键点是找规律,思考全面所有的情况。 13 Roman to Integer Roman numerals are represented by seven different symbols: I, V, X, L, C, D...

2018-10-06 13:55:41

阅读数 45

评论数 0

4.1 python数据结构之串——概述和基本算法

概述: 字符串(string)简称串,也是一种线性结构。在python中和array差不多,因为py的数组也可以包括各种字符(在C/Java一类的语法中,数组必须是同一种数据类型的元素)。线性结构,有限序列,是主要特点。串其中可以包含各种元素,也是计算机主要处理的一类对象。因此,串的题目涉及的范...

2018-10-02 16:39:39

阅读数 47

评论数 0

3.2.2 LeetCode数组类题目选做(2)—— Spiral Matrix & Rotate Image & Set Matrix Zeroes

Array 类题目选做之二 二维矩阵 54. Spiral Matrix Given a matrix of m x n elements (m rows, n columns), return all elements of the matrix in spiral order. Exam...

2018-09-12 20:28:06

阅读数 47

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭