自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 协同过滤及其实践

主题我将在这篇文章中简单介绍一下协同过滤,介绍下协同过滤的定义,介绍基于物品和基于用户协同过滤的含义和区别,重点介绍一下基于物品协同过滤的共现矩阵实现方式。以此文记录下我学习协同过滤的的心得和实践感受,内容较为主观,有问题可以提出。协同过滤协同过滤推荐方法的主要思想是利用用户群过去的行为来预测当前...

2016-12-12 14:36:54

阅读数 2761

评论数 0

原创 Python DataFarme 存取数据库方式及其性能

前言 在实际开发过程中发现Python Pandas.DataFrame 包含直接读取MySQL表及存储MySQL表的函数,于是测试了不同方式读数据、写MySQL表数据的代码简易性及性能的研究。 读数据 原有读数据方式: def query_to_df(query, conn): try:...

2019-11-29 20:06:18

阅读数 13

评论数 0

原创 LeetCode[BFS]----Word Ladder II

Given two words (beginWord and endWord), and a dictionary's word list, find all shortest transformation sequence(s) from beginWord to endWord, s...

2018-12-12 21:06:45

阅读数 76

评论数 0

原创 LeetCode[BFS]----Word Ladder

Given two words (beginWord and endWord), and a dictionary's word list, find the length of shortest transformation sequence from beginWord to end...

2018-12-12 20:57:58

阅读数 85

评论数 0

原创 pyspark开发总结笔记

本文记录spark开发过程中遇到的小知识点,使用pyspark开发,由于使用大多数场景为DataFrame,介绍也多为DataFrame。本文比较长,在学习过程中摘了一些博客和资料,如果有描述的不对的地方请指出。 Spark是分布式内存计算,能够依据各类操作创建一个计算DAG图,数据通过DAG处...

2018-11-29 13:50:03

阅读数 375

评论数 0

原创 LeetCode[in-place]----Set Matrix Zeroes

Given a m x n matrix, if an element is 0, set its entire row and column to 0. Do it in-place. Example 1: Input: [   [1,1,1],   [1,0,1],   [1,1,1]...

2018-11-22 13:50:00

阅读数 53

评论数 0

原创 LeetCode[Math]----Sqrt(x)

Implement int sqrt(int x). Compute and return the square root of x, where x is guaranteed to be a non-negative integer. Since the return type is an...

2018-11-07 10:30:10

阅读数 112

评论数 0

原创 完美韵脚----让押韵变得简单

把押韵的活全部承揽 降低诗词的创作门槛 本文导言: 用Python+Django+Apache在工作之余做了一个押韵搜索的网站:完美韵脚(wanmeiyunjiao.com);这里借自己的博客做下推广,不做技术分享。 完美韵脚用来帮助词作人、诗人、Rapper歌手和文案创作者更好更方便...

2018-09-07 20:17:04

阅读数 66455

评论数 10

原创 使用sklearn进行增量学习

问题实际处理和解决机器学习问题过程中,我们会遇到一些“大数据”问题,比如有上百万条数据,上千上万维特征,此时数据存储已经达到10G这种级别。这种情况下,如果还是直接使用传统的方式肯定行不通,比如当你想把数据load到内存中转成numpy数组,你会发现要么创建不了那么大的numpy矩阵,要么直接加载...

2016-11-10 19:50:21

阅读数 22092

评论数 9

原创 Apriori算法实现

Apriori简介Apriori是挖掘关联规则的频繁项集算法。 频繁项集(frequent item set):经常出现在一起的物品集合。 关联规则(association rule):暗示两种物品之间可能存在很强的关系。 支持度(support):交易包含X∪Y总交易量\frac{交易包含X\c...

2016-09-02 11:33:18

阅读数 1769

评论数 2

转载 机器学习算法比较

本文转载自:http://www.csuldw.com/2016/02/26/2016-02-26-choosing-a-machine-learning-classifier/ 本文主要回顾下几个常用算法的适应场景及其优缺点!(提示:部分内容摘自网络)。 机器学习算法太多了,分类、回...

2016-08-23 19:12:09

阅读数 722

评论数 0

原创 对于PRC和ROC曲线衡量分类器效果的思考

我们在分类中往往采用一些指标如Precision,Recall,ROC图来衡量一个分类器的分类效果。 在实际中遇到的数据往往是正负样本不平衡(class imbalance)的,比如假设100个人里面有1个是癌症患者,那么,分类器只要对所有样本返回非癌症即可获得99%的Accuracy,...

2016-07-23 20:24:25

阅读数 3088

评论数 2

原创 LeetCode[Bitwise]----Bitwise AND of Numbers Range

Bitwise AND of Numbers Range Given a range [m, n] where 0 For example, given the range [5, 7], you should return 4. 分析: 给定m和n,返回m到n闭区间内所有元素位运算...

2016-05-02 23:40:48

阅读数 766

评论数 0

原创 推荐系统的学习笔记

一直以来对推荐系统的学习和理解来自一些机器学习书中简单介绍(如《集体智慧编程》和《机器学习实战》)和自己网上搜的一些资料。而当被问及对推荐系统的改进和理解,发现自己对推荐系统所知甚少,除了知道几个常用的算法外,根本没有更深入的理解,更别提改进了。本篇博客为学习《推荐系统》一书的读书笔记,记录了常见...

2016-05-02 10:10:32

阅读数 4855

评论数 0

转载 推荐系统原理介绍

写在正文之前   最近在做推荐系统,在项目组内做了一个分享。今天有些时间,就将逻辑梳理一遍,将ppt内容用文字沉淀下来,便于接下来对推荐系统的进一步研究。推荐系统确实是极度复杂,要走的路还很长。   A First Glance     为什么需要推荐系统——信息过载   ...

2016-05-02 10:10:06

阅读数 1016

评论数 0

原创 LeetCode[Stack]----Min Stack&Stack&Queue

整理一下LeetCode上三道与栈有关的题,分别是Implement Queue using Stacks,Implement Stack using Queues和Min Stack。 1.Implement Queue using Stacks Implemen...

2016-04-30 15:25:48

阅读数 3791

评论数 0

转载 Logistic回归总结

Logistic回归总结 作者:洞庭之子 微博:洞庭之子-Bing (2013年11月) PDF下载地址:http://download.csdn.net/detail/lewsn2008/6547463 1.引言 看了Stanford的Andrew Ng老师的机器学习公开课中关于...

2016-04-29 20:09:15

阅读数 629

评论数 0

转载 从最大似然到EM算法浅解

从最大似然到EM算法浅解 zouxy09@qq.com http://blog.csdn.net/zouxy09          机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了...

2016-04-27 10:15:52

阅读数 536

评论数 0

原创 LeetCode[Design]----Peeking Iterator

Peeking Iterator Given an Iterator class interface with methods: next() and hasNext(), design and implement a PeekingIterator that support the...

2016-04-22 21:11:02

阅读数 2087

评论数 0

原创 LeetCode[Math]----Excel Sheet Column Title----Excel Sheet Column Number

Excel Sheet Column Title Given a positive integer, return its corresponding column title as appear in an Excel sheet. For example: 1 -&g...

2016-04-22 16:28:27

阅读数 1292

评论数 0

原创 LeetCode[Array]---- 4Sum

4Sum Given an array S of n integers, are there elements a, b, c, and d in S such that a + b + c + d = target? Find all unique quadruplets in t...

2016-04-19 11:28:08

阅读数 755

评论数 0

原创 LeetCode[Array]----3Sum Closest

3Sum Closest   Given an array S of n integers, find three integers in S such that the sum is closest to a given number, target. Return the su...

2016-04-19 10:03:10

阅读数 709

评论数 0

原创 LeetCode[Array]----3Sum

3Sum Given an array S of n integers, are there elements a, b, c in S such that a + b + c = 0? Find all unique triplets in the array which gives t...

2016-04-18 21:20:11

阅读数 639

评论数 0

转载 支持向量机

转载自:http://www.hankcs.com/ml/support-vector-machine.html 码农场 » 支持向量机 本文是《统计学习方法》第七章《支持向量机》的笔记,附带了少量注解和背景知识的补充;后半部分将《机器学习实战》支持向量机的Python代码加以整理注释,与公...

2016-03-30 08:32:54

阅读数 7669

评论数 1

原创 NumPy学习笔记2

生成特殊矩阵In [187]: ones = eye(3, dtype=int) # 生成3 * 3的单位矩阵In [188]: ones Out[188]: array([[1, 0, 0], [0, 1, 0], [0, 0, 1]])In [226]: zer...

2016-03-27 08:38:31

阅读数 853

评论数 0

原创 NumPy学习笔记1

NumPy:一个第三方的Python模块,主要提供数值计算功能,大部分由C语言实现,在处理数组,矩阵等方面比单纯用Python实现快得多,提供了大量的矩阵运算的函数库,是用Python进行数值计算&DM&ML的好工具。 NumPy 的学习,也不能期望一步就都学会了,需要慢慢来吧,里...

2016-03-27 08:35:20

阅读数 608

评论数 0

原创 Python在线笔试琐碎

Python在线笔试琐碎 从开学来一直狂投简历,等了一个月不过收到两份在线笔试,连一次正式面试都没有,感觉快撑不下去了。这篇博客记录一下在线笔试用Python写算法题时需要注意的一些事项。 处理输入一些大公司的在线笔试似乎都承包给了第三方,那个平台下的在线写代码功能真是不能再渣。它并不像Lee...

2016-03-26 13:39:20

阅读数 3746

评论数 1

原创 Django入门笔记

看的Django 1.8.2 中文文档,地址:http://python.usyiyi.cn/django_182/intro/tutorial01.html ,想学习的直接看这个文档吧。这篇文章全是摘的中文文档的内容的。 1. 创建一个项目 在命令行中,进入你要用来保存代码的...

2016-03-12 21:49:13

阅读数 752

评论数 0

原创 LeetCode----Lowest Common Ancestor of a Binary Tree

Lowest Common Ancestor of a Binary Tree Given a binary tree, find the lowest common ancestor (LCA) of two given nodes in the tree. Accordin...

2016-03-08 14:44:40

阅读数 556

评论数 0

原创 LeetCode----Lowest Common Ancestor of a Binary Search Tree

Lowest Common Ancestor of a Binary Search Tree Given a binary search tree (BST), find the lowest common ancestor (LCA) of two given nodes in the...

2016-03-08 14:00:40

阅读数 458

评论数 0

原创 LeetCode----Remove Nth Node From End of List

Remove Nth Node From End of List Given a linked list, remove the nth node from the end of list and return its head. For example, Given ...

2016-02-29 09:19:46

阅读数 499

评论数 0

原创 LeetCode----Maximum Product Subarray

Maximum Product Subarray Find the contiguous subarray within an array (containing at least one number) which has the largest product. For e...

2016-02-27 15:44:38

阅读数 546

评论数 0

原创 LeetCode----Product of Array Except Self

Product of Array Except Self Given an array of n integers where n > 1, nums, return an array output such that output[i] is equal to the...

2016-02-26 21:05:36

阅读数 549

评论数 0

原创 numpy的argsort和sum和tile函数

在使用这几个函数时遇到一些问题记录一下,个人理解,不一定正确。 问题1: argsort的函数返回值是什么? 比如有语句: In [40]: distances Out[40]: array([ 1.48660687,  1.41421356,  0.        ,  0.1    ...

2016-01-13 20:22:03

阅读数 1939

评论数 1

原创 Python&按键精灵自动化

最近在项目中需要进行软件的自动化操作。 本博文以两种方式介绍如何自动化打开软件(Windows下),对其进行最大化最小化关闭等操作。 Python操作: 第一次接触自动化。相对比较熟悉Python自然是希望通过Python来操作软件。一般来说,通过程序来操作软件需要获得该软件的句柄,...

2015-12-25 11:24:54

阅读数 35999

评论数 7

原创 Python定时任务

Python下实现定时任务的方式有很多种方式。 循环sleep: 这是一种最简单的方式,在循环里放入要执行的任务,然后sleep一段时间再执行。缺点是,不容易控制,而且sleep是个阻塞函数。 def timer(n): ''' 每n秒执行一次 ...

2015-12-09 10:23:29

阅读数 38439

评论数 3

原创 LeetCode----Isomorphic Strings

Isomorphic Strings Given two strings s and t, determine if they are isomorphic. Two strings are isomorphic if the characters in s can be re...

2015-12-02 09:05:44

阅读数 509

评论数 0

原创 简单的FTP共享文件pyftpdlib

共享文件夹或者文件除了上一篇文章中所说的Http方式,还有FTP方式,即搭建一个FTP服务器,共享文件夹,让别人访问。 安装pyftpdlib: Python并没有内置一个FTP服务器,所以需要第三方模块的支持。可以使用pyftpdlib,其官网上有详细的介绍。 在命令行输入下面的语...

2015-11-29 11:01:08

阅读数 6783

评论数 0

原创 简单的Http共享文件SimpleHTTPServer

刚刚学会了如何使用Python下的SimpleHTTPServer共享文件。 一句话共享: 命令行下输入下面的语句,即可将当前目录下的文件共享出去。 python -m SimpleHTTPServer 80Python下内置了一个Http服务器,只需要上面的一句话即可以启动该服务器,默认的端...

2015-11-29 09:27:34

阅读数 4843

评论数 0

原创 LeetCode----Insertion Sort List

Insertion Sort List Sort a linked list using insertion sort. 原题链接为:https://leetcode.com/problems/insertion-sort-list 分析: 使用插入排序对链表进行排序。 可以新建一个带头...

2015-11-14 17:16:52

阅读数 487

评论数 0

提示
确定要删除当前文章?
取消 删除