自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(156)
  • 资源 (12)
  • 收藏
  • 关注

原创 协同过滤及其实践

主题我将在这篇文章中简单介绍一下协同过滤,介绍下协同过滤的定义,介绍基于物品和基于用户协同过滤的含义和区别,重点介绍一下基于物品协同过滤的共现矩阵实现方式。以此文记录下我学习协同过滤的的心得和实践感受,内容较为主观,有问题可以提出。协同过滤协同过滤推荐方法的主要思想是利用用户群过去的行为来预测当前用户可能喜欢哪些物品或者对哪些物品感兴趣。其包含两种协同过滤技术,一种是Memory Based的协同过

2016-12-12 14:36:54 3314

原创 Apache24配置https

这里写自定义目录标题前言申请https证书配置https放证书文件1. 配置httpd.conf1.1 将配置文件中下面两行取消注释,开启ssl。1.2 将配置文件中下面一行取消注释,注意 httpd-ahssl.conf 不要取消注释2. 配置httpd-ssl.conf2.1 监听443端口2.2 配置ServerName2.3 配置证书文件2.4 最终简略配置重启Apache坑&其他参考博客前言最近想把完美韵脚搞个小程序版,微信小程序需要https形式的访问,简单的了解后进行了对项目进行项

2020-05-18 21:52:19 135

原创 Python DataFarme 存取数据库方式及其性能

前言在实际开发过程中发现Python Pandas.DataFrame 包含直接读取MySQL表及存储MySQL表的函数,于是测试了不同方式读数据、写MySQL表数据的代码简易性及性能的研究。读数据原有读数据方式:def query_to_df(query, conn): try: cur = conn.cursor() cur.execute(qu...

2019-11-29 20:06:18 111

原创 LeetCode[BFS]----Word Ladder II

Given two words (beginWord and endWord), and a dictionary's word list, find all shortest transformation sequence(s) from beginWord to endWord, such that:Only one letter can be changed at a time Eac...

2018-12-12 21:06:45 134

原创 LeetCode[BFS]----Word Ladder

Given two words (beginWord and endWord), and a dictionary's word list, find the length of shortest transformation sequence from beginWord to endWord, such that:Only one letter can be changed at a ti...

2018-12-12 20:57:58 142

原创 pyspark开发总结笔记

本文记录spark开发过程中遇到的小知识点,使用pyspark开发,由于使用大多数场景为DataFrame,介绍也多为DataFrame。本文比较长,在学习过程中摘了一些博客和资料,如果有描述的不对的地方请指出。Spark是分布式内存计算,能够依据各类操作创建一个计算DAG图,数据通过DAG处理后生成结果。对spark的数据操作分为两类,一类是转换(transformation)操作,比如Fi...

2018-11-29 13:50:03 1104

原创 LeetCode[in-place]----Set Matrix Zeroes

Given a m x n matrix, if an element is 0, set its entire row and column to 0. Do it in-place.Example 1:Input: [  [1,1,1],  [1,0,1],  [1,1,1]]Output: [  [1,0,1],  [0,0,0],  [1,0,1]]E...

2018-11-22 13:50:00 94

原创 LeetCode[Math]----Sqrt(x)

Implement int sqrt(int x).Compute and return the square root of x, where x is guaranteed to be a non-negative integer.Since the return type is an integer, the decimal digits are truncated and only...

2018-11-07 10:30:10 181

原创 完美韵脚----让押韵变得简单

把押韵的活全部承揽降低诗词的创作门槛本文导言:用Python+Django+Apache在工作之余做了一个押韵搜索的网站:完美韵脚(wanmeiyunjiao.com);这里借自己的博客做下推广,不做技术分享。完美韵脚用来帮助词作人、诗人、Rapper歌手和文案创作者更好更方便地进行创作的押韵搜索网站。数据库包含了数十万首中文歌词和古诗词(使用Python爬虫下载的),有着全面...

2018-09-07 20:17:04 137280 16

原创 使用sklearn进行增量学习

问题实际处理和解决机器学习问题过程中,我们会遇到一些“大数据”问题,比如有上百万条数据,上千上万维特征,此时数据存储已经达到10G这种级别。这种情况下,如果还是直接使用传统的方式肯定行不通,比如当你想把数据load到内存中转成numpy数组,你会发现要么创建不了那么大的numpy矩阵,要么直接加载时报MemeryError。 在这种情况下我了解了几种选择办法,1. 对数据进行降维,2. 使用流式或

2016-11-10 19:50:21 27892 10

原创 Apriori算法实现

Apriori简介Apriori是挖掘关联规则的频繁项集算法。频繁项集(frequent item set):经常出现在一起的物品集合。关联规则(association rule):暗示两种物品之间可能存在很强的关系。支持度(support):交易包含X∪Y总交易量\frac{交易包含X\cup Y}{总交易量}置信度\可信度(confindence):交易包含X∪Y交易量包含X=X→Y\f

2016-09-02 11:33:18 2193 2

转载 机器学习算法比较

本文转载自:http://www.csuldw.com/2016/02/26/2016-02-26-choosing-a-machine-learning-classifier/本文主要回顾下几个常用算法的适应场景及其优缺点!(提示:部分内容摘自网络)。机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启

2016-08-23 19:12:09 813

原创 对于PRC和ROC曲线衡量分类器效果的思考

我们在分类中往往采用一些指标如Precision,Recall,ROC图来衡量一个分类器的分类效果。在实际中遇到的数据往往是正负样本不平衡(class imbalance)的,比如假设100个人里面有1个是癌症患者,那么,分类器只要对所有样本返回非癌症即可获得99%的Accuracy,然而此时的分类器并没有意义,它不能识别任何的癌症患者。此时我们需要Precision,Recall,调

2016-07-23 20:24:25 3731 2

原创 LeetCode[Bitwise]----Bitwise AND of Numbers Range

Bitwise AND of Numbers RangeGiven a range [m, n] where 0 For example, given the range [5, 7], you should return 4.分析:给定m和n,返回m到n闭区间内所有元素位运算&后的结果。我们知道a和b进行And操作时,在a和b同时为1的时候结果才为1.

2016-05-02 23:40:48 823

原创 推荐系统的学习笔记

一直以来对推荐系统的学习和理解来自一些机器学习书中简单介绍(如《集体智慧编程》和《机器学习实战》)和自己网上搜的一些资料。而当被问及对推荐系统的改进和理解,发现自己对推荐系统所知甚少,除了知道几个常用的算法外,根本没有更深入的理解,更别提改进了。本篇博客为学习《推荐系统》一书的读书笔记,记录了常见的推荐算法和其思想。 ps:推荐系统入门学习可以看蒋凡先生翻译的《推荐系统》和项量的《推荐系

2016-05-02 10:10:32 5152

转载 推荐系统原理介绍

写在正文之前 最近在做推荐系统,在项目组内做了一个分享。今天有些时间,就将逻辑梳理一遍,将ppt内容用文字沉淀下来,便于接下来对推荐系统的进一步研究。推荐系统确实是极度复杂,要走的路还很长。 A First Glance  为什么需要推荐系统——信息过载 随着互联网行业的井喷式发展,获取信息的方式越来越多,人们从主

2016-05-02 10:10:06 1102

原创 LeetCode[Stack]----Min Stack&Stack&Queue

整理一下LeetCode上三道与栈有关的题,分别是Implement Queue using Stacks,Implement Stack using Queues和Min Stack。1.Implement Queue using StacksImplement the following operations of a queue using stacks.

2016-04-30 15:25:48 3906

转载 Logistic回归总结

Logistic回归总结作者:洞庭之子微博:洞庭之子-Bing(2013年11月)PDF下载地址:http://download.csdn.net/detail/lewsn2008/65474631.引言看了Stanford的Andrew Ng老师的机器学习公开课中关于Logistic Regression的讲解,然后又看了《机器学习实战》中

2016-04-29 20:09:15 672

转载 从最大似然到EM算法浅解

从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.csdn.net/zouxy09        机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什

2016-04-27 10:15:52 591

原创 LeetCode[Design]----Peeking Iterator

Peeking IteratorGiven an Iterator class interface with methods: next() and hasNext(), design and implement a PeekingIterator that support the peek() operation -- it essentially peek() at the

2016-04-22 21:11:02 2132

原创 LeetCode[Math]----Excel Sheet Column Title----Excel Sheet Column Number

Excel Sheet Column TitleGiven a positive integer, return its corresponding column title as appear in an Excel sheet.For example: 1 -> A 2 -> B 3 -> C ... 26 -> Z 27

2016-04-22 16:28:27 1374

原创 LeetCode[Array]---- 4Sum

4SumGiven an array S of n integers, are there elements a, b, c, and d in S such that a + b + c + d = target? Find all unique quadruplets in the array which gives the sum of target.Note:

2016-04-19 11:28:08 802

原创 LeetCode[Array]----3Sum Closest

3Sum Closest Given an array S of n integers, find three integers in S such that the sum is closest to a given number, target. Return the sum of the three integers. You may assume that each i

2016-04-19 10:03:10 764

原创 LeetCode[Array]----3Sum

3SumGiven an array S of n integers, are there elements a, b, c in S such that a + b + c = 0? Find all unique triplets in the array which gives the sum of zero.Note:Elements in a tr

2016-04-18 21:20:11 689

转载 支持向量机

转载自:http://www.hankcs.com/ml/support-vector-machine.html 码农场 » 支持向量机本文是《统计学习方法》第七章《支持向量机》的笔记,附带了少量注解和背景知识的补充;后半部分将《机器学习实战》支持向量机的Python代码加以整理注释,与公式放到一起形成对照,辅助理解。私以为,没有泛函分析基础的人是无法深刻理解支持向量机的,更不能随

2016-03-30 08:32:54 8563 1

原创 NumPy学习笔记2

生成特殊矩阵In [187]: ones = eye(3, dtype=int) # 生成3 * 3的单位矩阵In [188]: onesOut[188]: array([[1, 0, 0], [0, 1, 0], [0, 0, 1]])In [226]: zeros((2, 3), dtype=int) # 生成2 * 3的零矩阵Out[226]: arra

2016-03-27 08:38:31 1007

原创 NumPy学习笔记1

NumPy:一个第三方的Python模块,主要提供数值计算功能,大部分由C语言实现,在处理数组,矩阵等方面比单纯用Python实现快得多,提供了大量的矩阵运算的函数库,是用Python进行数值计算&DM&ML的好工具。NumPy 的学习,也不能期望一步就都学会了,需要慢慢来吧,里面的内容很多,一次性都学了,不用的话忘得也快。前提:安装Python,NumPy,matplotlib,ipython,

2016-03-27 08:35:20 674

原创 Python在线笔试琐碎

Python在线笔试琐碎 从开学来一直狂投简历,等了一个月不过收到两份在线笔试,连一次正式面试都没有,感觉快撑不下去了。这篇博客记录一下在线笔试用Python写算法题时需要注意的一些事项。处理输入一些大公司的在线笔试似乎都承包给了第三方,那个平台下的在线写代码功能真是不能再渣。它并不像LeetCode以及其他OJ一样给定函数声明和函数头部,而是需要你自己去处理输入。首先,Python下的输入基

2016-03-26 13:39:20 4341 1

原创 Django入门笔记

看的Django 1.8.2 中文文档,地址:http://python.usyiyi.cn/django_182/intro/tutorial01.html ,想学习的直接看这个文档吧。这篇文章全是摘的中文文档的内容的。1. 创建一个项目在命令行中,进入你要用来保存代码的目录,然后输入如下命令:$ django-admin startproject mys

2016-03-12 21:49:13 801

原创 LeetCode----Lowest Common Ancestor of a Binary Tree

Lowest Common Ancestor of a Binary TreeGiven a binary tree, find the lowest common ancestor (LCA) of two given nodes in the tree.According to the definition of LCA on Wikipedia: “The lowes

2016-03-08 14:44:40 599

原创 LeetCode----Lowest Common Ancestor of a Binary Search Tree

Lowest Common Ancestor of a Binary Search TreeGiven a binary search tree (BST), find the lowest common ancestor (LCA) of two given nodes in the BST.According to the definition of LCA on Wiki

2016-03-08 14:00:40 507

原创 LeetCode----Remove Nth Node From End of List

Remove Nth Node From End of ListGiven a linked list, remove the nth node from the end of list and return its head.For example, Given linked list: 1->2->3->4->5, and n = 2. After re

2016-02-29 09:19:46 532

原创 LeetCode----Maximum Product Subarray

Maximum Product SubarrayFind the contiguous subarray within an array (containing at least one number) which has the largest product.For example, given the array [2,3,-2,4],the contiguous

2016-02-27 15:44:38 585

原创 LeetCode----Product of Array Except Self

Product of Array Except SelfGiven an array of n integers where n > 1, nums, return an array output such that output[i] is equal to the product of all the elements of nums except nums[i].

2016-02-26 21:05:36 601

原创 numpy的argsort和sum和tile函数

在使用这几个函数时遇到一些问题记录一下,个人理解,不一定正确。问题1: argsort的函数返回值是什么?比如有语句:In [40]: distancesOut[40]: array([ 1.48660687,  1.41421356,  0.        ,  0.1       ])    In [41]: distances.args

2016-01-13 20:22:03 2198 1

原创 Python&按键精灵自动化

最近在项目中需要进行软件的自动化操作。本博文以两种方式介绍如何自动化打开软件(Windows下),对其进行最大化最小化关闭等操作。Python操作:第一次接触自动化。相对比较熟悉Python自然是希望通过Python来操作软件。一般来说,通过程序来操作软件需要获得该软件的句柄,然后通过该句柄给软件发消息来操作该软件。Python中你需要安装Pywin32模块,该模块提供了访问W

2015-12-25 11:24:54 48854 7

原创 Python定时任务

Python下实现定时任务的方式有很多种方式。循环sleep:这是一种最简单的方式,在循环里放入要执行的任务,然后sleep一段时间再执行。缺点是,不容易控制,而且sleep是个阻塞函数。def timer(n): ''' 每n秒执行一次 ''' while True: print time.strftime('%Y-%m

2015-12-09 10:23:29 39296 3

原创 LeetCode----Isomorphic Strings

Isomorphic StringsGiven two strings s and t, determine if they are isomorphic.Two strings are isomorphic if the characters in s can be replaced to get t.All occurrences of a character

2015-12-02 09:05:44 556

原创 简单的FTP共享文件pyftpdlib

共享文件夹或者文件除了上一篇文章中所说的Http方式,还有FTP方式,即搭建一个FTP服务器,共享文件夹,让别人访问。安装pyftpdlib:Python并没有内置一个FTP服务器,所以需要第三方模块的支持。可以使用pyftpdlib,其官网上有详细的介绍。在命令行输入下面的语句进行安装:pip install pyftpdlib一句话共享:在选定目录的命令行下

2015-11-29 11:01:08 7942 1

原创 简单的Http共享文件SimpleHTTPServer

刚刚学会了如何使用Python下的SimpleHTTPServer共享文件。一句话共享:命令行下输入下面的语句,即可将当前目录下的文件共享出去。python -m SimpleHTTPServer 80Python下内置了一个Http服务器,只需要上面的一句话即可以启动该服务器,默认的端口是8000。启动后,可以在浏览器中输入“localhost:8000”即可查看当前文件

2015-11-29 09:27:34 5396

Apriori算法Python实现

Apriori算法Python实现

2016-09-02

百度地图应用样例

百度地图给我们提供很nice的API,我们在实际项目中可以调用这些API完成很多跟位置相关的操作。 样例将介绍如何使用API进行定位,标注,绘图等功能。 详情介绍:http://blog.csdn.net/whiterbear/article/details/36441827

2014-07-02

Python SAX处理XML文件

本代码是python下使用SAX才操作XML文件的。SAX是基于事件驱动的。在处理过程中,它将XML文档的处理转化为一系列事件的处理,通过事件处理器处理XML文档。它的速度很快,而且占用的内存很小,适用于一些比较大的XML文件。

2014-05-29

正则表达式匹配算法

借用代码之美中的正则表达式匹配代码,供大家学习用。

2013-12-10

微信飞机大战python

纯python写的微信大战游戏,需要运行在安装python环境中,附有整套游戏图片和音乐。

2013-10-11

Tiling_easy version,杭电2501题

Tiling_easy version,杭电acm的2501题,仅供参考啦。

2013-01-02

包括各种排序

各种排序啊,包括选择排序,插入排序,合并排序,快速排序

2012-12-18

python20.21 cookielib模块翻译.pdf

python20.21 cookielib模块翻译.pdf

2016-03-17

python版命令行2048

python版2048游戏,命令行中运行,代码讲解可参考博客 http://blog.csdn.net/whiterbear

2015-07-27

python练习册代码

python练习册代码,Show-Me-the-Code

2015-07-15

基于社交网络的情绪化分析

这是我毕设项目的源码,题目是《基于社交网络的情绪化分析》。意义是:使用数据分析的方法,从数学的角度去研究在社交网络上人们表达情绪的倾向。

2015-06-26

python cookielib模块的翻译文档

该PDF文档是翻译python标准库中的cookielib模块的内容。供大家学习,翻译的水平有限,有什么问题大家尽管指出,我会尽早改正。

2015-04-07

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除