Python
小松悦读会 | kevinelstri
小松悦读会,用心阅读,执着专注!
展开
-
Installer integrity check has failed 疑难杂症
Installer integrity check has failed 疑难杂症安装pycharm遇到问题:~~~ Installer integrity check has failed. Common causes include incomplete download and damaged media. Contact the installer’s author to obtain原创 2017-08-24 09:41:40 · 23373 阅读 · 0 评论 -
【scikit-learn】02:使用sklearn库进行统计学习
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.17# ----------------------# -----------------------# A tutorial on statistical-learning for scientific data p原创 2017-02-17 19:43:20 · 3826 阅读 · 0 评论 -
【scikit-learn】03:将sklearn库用于非监督性学习 聚类
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.16# ----------------------# -----------------------# Unsupervised learning: seeking representations of the data原创 2017-02-17 22:00:52 · 7728 阅读 · 0 评论 -
【scikit-learn】04:sklearn库下进行文本数据分析
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.21# ----------------------# -----------------------# Working With Text Data 文本数据处理# http://scikit-learn.o原创 2017-02-21 15:15:48 · 4479 阅读 · 0 评论 -
python 数据结构
# -*-coding:utf-8-*-# -----------------# Data Structures# -----------------import numpy as np''' Lists'''''' list.append(x):添加元素x list.extend(L):添加list列表L list.insert(i,x):在i位置插入元素x原创 2017-02-16 10:08:05 · 561 阅读 · 0 评论 -
python基础
# -*-coding:utf-8-*-# ---------# python基础# ---------# ---------# 数据类型# 整数:# 浮点数:可以使用科学记数法表示,1.23,3.14,-9.01# 字符串:# 布尔值:and or not运算,True,False# 空值:None# 变量:# 常量:# ------原创 2017-02-15 19:55:46 · 399 阅读 · 0 评论 -
python-Pandas基础
# -*-coding:utf-8-*-# -------------------# pandas 两种数据结构:Series和DataFrame# -------------------import pandas as pdfrom pandas import Series, DataFrameimport numpy as np'''pandas 功能: 数据丢失 插入原创 2017-02-15 20:00:12 · 602 阅读 · 0 评论 -
python-NumPy基础
# -*-coding:utf-8-*-# ----------------# Numpy:科学计算,主要是矩阵运算# ----------------# THE BASICSimport numpy as np''' Numpy的数组称为ndarry,也可以使用array来表示函数说明: ndarray.ndim:矩阵的维数 ndarray.shape:矩阵的行原创 2017-02-15 19:58:49 · 618 阅读 · 0 评论 -
python高级特性
# -*-coding:utf-8-*-# -----------------# 高级特性# -----------------# 构造一个列表L = []n = 1while n < 99: L.append(n) n = n + 2print L# ----------# 切片# ----------L = ['mich', 'sara', 'tracy',原创 2017-02-15 19:57:19 · 309 阅读 · 0 评论 -
python函数
# -*-coding:utf-8-*-# -----------------# 函数# -----------------print abs(-100) # abs函数:取绝对值print cmp(1, 2) # cmp函数,比较大小,如果x<y,返回-1,如果x=y,返回0,如果x>y,返回1# ---------------# 数据类型转换:# 数据的不同类型之间的转换原创 2017-02-15 19:56:37 · 300 阅读 · 0 评论 -
Pandas:Data_Structure_Series
# -*-coding:utf-8-*-import numpy as npimport pandas as pd""" Series"""""" Series 它是一个一维的标记阵列,可以容纳任何的数据类型(整型、字符串、浮点数、python对象), 轴标签统称为索引,轴就是纵向的。 最基本的创建Series序列:s = pd.Series(data,原创 2017-02-24 10:14:23 · 872 阅读 · 0 评论 -
Pandas 数据处理,数据清洗
# -*-coding:utf-8-*-from pandas import DataFrameimport pandas as pdimport numpy as np""" 获取行列数据"""df = DataFrame(np.random.rand(4, 5), columns=['A', 'B', 'C', 'D', 'E'])print dfprintdf['col_s原创 2017-02-23 22:12:30 · 4314 阅读 · 0 评论 -
python:pandas合并csv文件(图书数据集成)
两张表:ReaderInformation.csv,ReaderRentRecode.csvReaderInformation.csv: ReaderRentRecode.csv: pandas读取csv文件,并进行csv文件合并处理:# -*- coding:utf-8 -*-import csv as csvimport numpy as np# -------------# csv读取原创 2017-02-13 15:05:58 · 17175 阅读 · 0 评论 -
python文件
交互操作:input、raw_input、print打开文件:open(name, mode, suffer)读取文件:read()写入文件:write()管式输出:|读写行:file.readline(),file.readlines(),writelines()关闭文件:close()# -*- coding:utf-8 -*-########################## open(n原创 2017-02-10 17:19:06 · 1832 阅读 · 0 评论 -
【scikit-learn】01:使用案例对sklearn库进行简单介绍
sklearn学习笔记:Quick Start 源地址:http://scikit-learn.org/stable/tutorial/basic/tutorial.html# -*-coding:utf-8-*-''' Author:kevinelstri Datetime:2017.2.16'''# -----------------------# An introdu原创 2017-02-16 18:59:47 · 10661 阅读 · 1 评论 -
【scikit-learn】05:sklearn文本分类及评价指标
今天看到一句话: 你能留给岁月的,岁月能留给你的,除了一个更好的自己,别无其他。还能什么比这更能激励自己学习呢?在windows下安装sklearn,直接下载winpython安装就行了。自行选择32或64位。 http://sourceforge.net/projects/winpython/后面本文都把sklearn简称sk。sk已经自带了一些数据集,先看iris和digits:fro原创 2016-09-23 14:44:00 · 7923 阅读 · 1 评论 -
【scikit-learn】07:数据加载,数据归一,特征选择,逻辑回归,贝叶斯,k近邻,决策树,SVM
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python3.x在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。原创 2016-09-23 11:51:15 · 5819 阅读 · 1 评论 -
Chunkize warning while installing gensim 疑难杂症
UserWarning: detected Windows; aliasing chunkize to chunkize_serial warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")解决方案: 在import gensim前面加入:import warningswarnings.filterwar原创 2017-08-16 19:16:17 · 10361 阅读 · 4 评论 -
python使用JPype来运行java文件
1、下载JPype(注意版本,这里就不介绍了) 2、使用方法:# -*-coding:utf-8-*-# import jpype## jvmPath = jpype.getDefaultJVMPath() # 默认 JVM 路径# jpype.startJVM(jvmPath) # start# jpype.java.lang.System.out.println("hello wo原创 2017-04-27 12:30:59 · 2315 阅读 · 0 评论 -
最火的3个Python机器学习库
对于python的学习,首先是对语言的理解,其次就是python库的学习,从Numpy,Pandas,Scipy,Matplotlib的基础库的使用,到Sklearn机器学习库的使用,这也是python学习发展的主线,下面就介绍三个最牛的python机器学习库,之后将会对这三个机器学习库进行深入探究。转载自:opensource 尽管并不一定是数据科学家对机器学习的世界着迷,但是一些旅行指南可能会原创 2017-03-12 10:04:20 · 19123 阅读 · 0 评论 -
Python从入门到放弃
Python基础知识:Python列表 Python元组 Python字符串 Python字典 Python正则 Python字典排序 Python编码Python正则表达式 Python集合 Python map Python reduce Python lambda原创 2016-10-19 22:57:43 · 53429 阅读 · 24 评论 -
【Pandas-Cookbook】05:DataFrame框架案例
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# ---------------------# Chapter 5: Combining dataframes and scraping Canadian w原创 2017-02-17 16:14:01 · 791 阅读 · 0 评论 -
【Pandas-Cookbook】08:时间戳处理
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17# ---------------------# Chapter 8 - How to deal with timestamps.ipynb# ---------------------import pandas as pd''' 8.1 Parsing Unix timestamps'原创 2017-02-17 15:56:22 · 3069 阅读 · 1 评论 -
【Pandas-Cookbook】09:加载SQL数据库数据
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17# ---------------------# Chapter 9 - Loading data from SQL databases.ipynb# ---------------------import sqlite3import pandas as pd''' pandas ca原创 2017-02-17 15:55:19 · 698 阅读 · 0 评论 -
【Pandas-Cookbook】07:数据清洗
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# ---------------------# Chapter 7 - Cleaning up messy data.ipynb 清理垃圾数据# ----原创 2017-02-17 15:53:17 · 781 阅读 · 0 评论 -
【Pandas-Cookbook】06:字符串操作
# -*-coding:utf-8-*-# by kevinelstri# 2017.2.17import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# ---------------------# Chapter 6 - String Operations- Which month was the snowie原创 2017-02-17 10:25:00 · 854 阅读 · 0 评论 -
【Pandas-Cookbook】04:分组、聚集
# -*-coding:utf-8-*-# ---------------------# Chapter 4: Find out on which weekday people bike the most with groupby and aggregate# ---------------------import pandas as pdimport matplotlib.pyplot as原创 2017-02-16 15:51:14 · 843 阅读 · 0 评论 -
【Pandas-Cookbook】02:数据选择
# -*-coding:utf-8-*-# ---------------------# Chapter 2 - Selecting data & finding the most common complaint type.ipynb# ---------------------import pandas as pdimport matplotlib.pyplot as plt# pd.se原创 2017-02-16 15:40:08 · 887 阅读 · 0 评论 -
【Pandas-Cookbook】03:噪音数据处理
# -*-coding:utf-8-*-# ---------------------# Chapter 3 - Which borough has the most noise complaints (or, more selecting data).ipynb# ---------------------import pandas as pdimport matplotlib.pyplot原创 2017-02-16 15:43:33 · 1602 阅读 · 0 评论 -
【Pandas-Cookbook】01:读取CSV数据
# -*-coding:utf-8-*-# ---------------------# Chapter 1 - Reading from a CSV.ipynb# ---------------------import pandas as pdimport matplotlib.pyplot as plt# pd.set_option('display.mpl_style', 'defaul原创 2017-02-16 15:36:46 · 1403 阅读 · 2 评论 -
python函数
# -*-coding:utf-8-*-import cmathimport math################################################## x = pi# abs(x) 返回数字的绝对值# cmath.sqrt(x) # 返回平方根,也适用于负数# float(x) # 转换成浮点数# input() # 用于用户输入# int(原创 2017-02-10 16:12:33 · 2380 阅读 · 1 评论 -
Python字典
# -*- coding:UTF-8 -*-import numpy as npdef read_dict(): # 创建和使用字典 #(1) names = ['alice', 'beth', 'cecil', 'dee', 'earl'] numbers = ['2341', '7327', '2323', '3157', '5551'] d = {}原创 2016-10-16 20:05:41 · 2767 阅读 · 0 评论 -
Python字符串
# -*- coding:UTF-8 -*-def read_str(): tag = "<a href=http://www.baidu.com>baidu indexpage</a>" print 'tag[8:28]=', tag[8:28] print 'tag[29:-4]=', tag[29:-4] # 字符串替换replace tag.replac原创 2016-10-16 20:03:07 · 3527 阅读 · 0 评论 -
python使用xlrd模块读写Excel文件的方法
python使用xlrd模块读写Excel文件的方法一、安装xlrd模块到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。二、使用介绍1、导入模块 import xlrd2、打开Excel文件读取数据 data = xlrd.open_workbook('excelFile.xls')3、使用技巧 获取一个工作表 t原创 2016-09-30 14:12:46 · 1338 阅读 · 0 评论 -
Python re模块
re模块共有7种方法:# -*- coding:UTF-8 -*-import re'''re.compile(string[, flags])re.match(pattern, string[, flags])re.search(pattern, string[, flags])re.split(pattern, string[, maxsplit])re.findall(pattern原创 2016-10-24 16:11:04 · 2806 阅读 · 0 评论 -
Python中urllib和urllib2库的用法
使用urllib和urllib2抓取网页:# -*- coding:UTF-8 -*-import urllib2import urllib# 1、抓取网页response = urllib2.urlopen("http://www.baidu.com/")print response.read()'''分析: response = urllib2.urlopen("http://w原创 2016-10-24 15:04:41 · 6474 阅读 · 0 评论 -
Python操作Excel--xlwt
xlwt操作:# -*- coding:UTF-8 -*-import xlwtfile = xlwt.Workbook()table = file.add_sheet('sheet name') # 新建一个sheet# table.write(0, 0, 'test') # 写入数据table.write(行,列,value)for i in range(0, 10): for j原创 2016-10-11 14:05:37 · 1799 阅读 · 0 评论 -
【超强教程】python在64位操作系统下的安装
1、安装python-2.7.12.amd64.msi: Python的官网下载地址:https://www.python.org/download/ 2、直接双击安装,选择环境搭建,这样在python安装完成之后就不需要再搭建环境了3、pip安装: Python安装pip之前需要安装一个叫做ez_setup.py的程序 ez_setup.py程序网址在这里https://pypi.原创 2016-09-22 01:04:58 · 9292 阅读 · 0 评论 -
Python操作Excel--xlrd
1、安装xlrd模块 http://pypi.python.org/pypi/xlrd2、使用介绍 (1)导入模块import xlrd(2)打开Excel,读取数据workbook = xlrd.open_workbook("20142015.xls")(3)获取工作表table = workbook.sheets()[0]table = data.sheet_by_index(0) #通过原创 2016-10-10 17:37:03 · 2410 阅读 · 2 评论 -
【机器学习实战02】使用k-近邻算法改进约会网站的配对效果
程序流程:1.收集数据:提供文本文件2.准备数据:使用Python解析文本文件3.分析数据:使用Matplotlib画二维扩散图4.测试算法:使用提供的部分数据作为测试样本。测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据,如果预测分类与实际类别不同,则标记为一个错误5.使用算法:产生简单的命令行程序,然后可以输入一些特征数据以判断结果本样本共有三种特征:每年获得的飞行常客里程数:The原创 2016-08-15 14:56:36 · 737 阅读 · 0 评论