- 博客(23)
- 资源 (9)
- 收藏
- 关注
原创 MySQL大咖一日行
MySQL开发基础:【MySQL 00】MySQL数据表 【MySQL 01】查询–总结 【MySQL 02】数据库总结 【MySQL 03】各种数据库对应的jar包、驱动类名和URL格式 【MySQL 04】命令行查询乱码问题 【MySQL 05】使用Java对MySQL进行操作(创建数据库) 【MySQL 06】事务处理 【MySQL 07】数据库恢复技术 【MySQL 08】存
2016-10-29 11:20:07 873
原创 Python从入门到放弃
Python基础知识:Python列表 Python元组 Python字符串 Python字典 Python正则 Python字典排序 Python编码Python正则表达式 Python集合 Python map Python reduce Python lambda
2016-10-19 22:57:43 53418 24
原创 Python数据可视化:Matplotlib 直方图、箱线图、条形图、热图、折线图、散点图。。。
介绍 使用Python进行数据分析,数据的可视化是数据分析结果最好的展示方式,这里从Analytic Vidhya中找到的相关数据,进行一系列图形的展示,从中得到更多的经验。 强烈推荐:Analytic VidhyaPython数据可视化库Matplotlib:其能够支持所有的2D作图和部分3D作图。能通过交互环境做出印刷质量的图像。Seaborn:基于Matplotli
2016-10-26 21:43:11 83569 11
原创 Python数据可视化:箱线图
一、箱线图概念 箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。 计算过程: (1)计算上四分位数(Q3),中位数,下四分位数(Q1) (2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1 (3)绘制箱线图的上下范围,上限为上四分位数,下
2016-10-26 19:01:39 46369 1
原创 Python re模块
re模块共有7种方法:# -*- coding:UTF-8 -*-import re'''re.compile(string[, flags])re.match(pattern, string[, flags])re.search(pattern, string[, flags])re.split(pattern, string[, maxsplit])re.findall(pattern
2016-10-24 16:11:04 2797
原创 Python中urllib和urllib2库的用法
使用urllib和urllib2抓取网页:# -*- coding:UTF-8 -*-import urllib2import urllib# 1、抓取网页response = urllib2.urlopen("http://www.baidu.com/")print response.read()'''分析: response = urllib2.urlopen("http://w
2016-10-24 15:04:41 6469
原创 Python lambda
1、lambda函数基础:lambda函数也叫匿名函数,即函数没有具体的名称,而用def创建的方法是有名称的。如下:# 函数创建时,是需要进行命名的def foo(): return 'beginman' # lambda关键字创建匿名函数lambda:'beginman' # 保存并调用bar = lambda:'beginman'print bar() lamba语法:
2016-10-17 09:50:40 1653
原创 Python reduce
reduce函数:def reduce(function, iterable, initializer=None): it = iter(iterable) if initializer is None: try: initializer = next(it) except StopIteration:
2016-10-16 23:35:17 1730
原创 Python map
map()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回。 # 1、调用function函数,返回一个list>>> def add100(x): return x+100 >>> hh = [11,22,33]>>> map(add100,hh)[111, 122, 133]# 2、多个参数之间的并行运算
2016-10-16 23:14:41 3686
原创 Python集合
# -*- coding:UTF-8 -*-''' set是一个无序且不重复的元素集合'''def read_set(): # 创建set s1 = set('qiwsit') print s1 # s1= set(['q', 'i', 's', 't', 'w']) s2 = set([123, 'google', 'face', 'book', 'fa
2016-10-16 21:44:16 1709
原创 Python正则表达式
# -*- coding:UTF-8 -*-def read_re(): # 匹配中文字符:[u4e00-u9fa5] # 匹配双字节字符(包括汉字):[^x00-xff] # 匹配空白行:ns*r # 匹配HTML标记:<(S*?)[^>]*>.*?|<.*?/> # 匹配首尾空白字符:^s*|s*$ # 匹配email地址:w+([-+.]w+)*
2016-10-16 20:47:49 2172
原创 Python编码
# -*- coding:UTF-8 -*-def read_code(): # 字符串在Python内部的表示是Unicode编码,因此,在编码转换时,通常需要以Unicode作为中间编码, # 先将其他编码的字符串解码(decode)成Unicode,再从Unicode编码(encode)成另一种编码。 # decode的作用:将其他编码转换成Unicode编码
2016-10-16 20:11:50 1822
原创 Python字典排序
# -*- coding:UTF-8 -*-def dict_sort(): # 按照value的值从大到小的顺序进行排序 dic = {'a': 31, 'bc': 5, 'c': 3, 'asd': 4, 'aa': 74, 'd': 0} dict = sorted(dic.items(), key=lambda d: d[1], reverse=True) # 默认
2016-10-16 20:10:06 1998
原创 Python正则
# -*- coding:UTF-8 -*-import re'''字符匹配: 元字符列表:.^$*+?{[]\|() \d 匹配任何十进制数 [0-9] \D 匹配任何非数字字符 [^0-9] \s 匹配任何空白字符 \S 匹配任何非空白字符 \w 匹配任何字母数字字符 [a-zA-Z0-9] \W 匹配任何非字母数字字符 [^a-zA-Z0
2016-10-16 20:07:44 2668
原创 Python字典
# -*- coding:UTF-8 -*-import numpy as npdef read_dict(): # 创建和使用字典 #(1) names = ['alice', 'beth', 'cecil', 'dee', 'earl'] numbers = ['2341', '7327', '2323', '3157', '5551'] d = {}
2016-10-16 20:05:41 2761
原创 Python字符串
# -*- coding:UTF-8 -*-def read_str(): tag = "<a href=http://www.baidu.com>baidu indexpage</a>" print 'tag[8:28]=', tag[8:28] print 'tag[29:-4]=', tag[29:-4] # 字符串替换replace tag.replac
2016-10-16 20:03:07 3518
原创 Python元组
# -*- coding:UTF-8 -*-def read_tuple(): # 创建元组 tuple = ('physic', 'chemistry', 1997, 2000) print tuple[2] tuple1 = (1,2,3) tuple += tuple1 print tuple # del tuple1 # print
2016-10-16 20:02:19 4485 1
原创 Python列表
# -*- coding:UTF-8 -*-def read_list(): # 创建列表list list = ['physics', 'chemistry', 1997, 2000] print list # 访问列表中的值 print list[1] # 删除列表元素 del list[1] print list # len()
2016-10-16 20:01:48 12865
原创 Python操作Excel--xlwt
xlwt操作:# -*- coding:UTF-8 -*-import xlwtfile = xlwt.Workbook()table = file.add_sheet('sheet name') # 新建一个sheet# table.write(0, 0, 'test') # 写入数据table.write(行,列,value)for i in range(0, 10): for j
2016-10-11 14:05:37 1790
原创 Python操作Excel--xlrd
1、安装xlrd模块 http://pypi.python.org/pypi/xlrd2、使用介绍 (1)导入模块import xlrd(2)打开Excel,读取数据workbook = xlrd.open_workbook("20142015.xls")(3)获取工作表table = workbook.sheets()[0]table = data.sheet_by_index(0) #通过
2016-10-10 17:37:03 2403 2
原创 python数据库编程
1、mysql的安装 www.mysql.com/downloads/2、python的安装 https://www.python.org/3、MySQL_python-1.2.5-cp27-none-win_amd64.whl,mysqlclient-1.3.8-cp27-cp27m-win_amd64.whl 的安装 (1)下载两个文件 (2)使用pip install MySQL_py
2016-10-10 16:37:44 2086
原创 数据分析大咖一日行
一、数据分析师有哪些要求?下图是数据分析师认证的基本内容(http://cda.pinggu.org/view/3.html),1至3级,从低到高。概括起来四点要求: 1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。 2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等 3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为
2016-10-10 09:49:40 2030
ourbestModel_highscore3500
2019-04-14
停用词表stopwords
2017-08-15
文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)
2017-04-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人