Python
hal_sakai
这个作者很懒,什么都没留下…
展开
-
Python SyntaxError: Non-ASCII character '\xe5'编码错误
在编写Python时,当使用中文输出或注释时运行脚本,会提示错误信息:SyntaxError: Non-ASCII character '\xe5' in file *******解决方法:python的默认编码文件是用的ASCII码,你将文件存成了UTF-8!!!(文件中存在中文或者其他语言,就会出现此问题!)解决办法很简单!!!在文件开头加入:# -*- cod转载 2016-07-27 20:50:04 · 480 阅读 · 0 评论 -
利用Python进行数据分析环境部署
系统环境:WIN7 64位+i54460+8G,micosoft visual studio 2010(不要装更高的版本,不然matlab R2011a用不了了:) )1.安装python27:python-2.7.12.amd64,目录d:\Python27(所有都勾上,尤其是pip,安装插件包要用)2.安装epd free(集成了numpy,scipy,matplotlib,ipyth原创 2016-07-20 17:54:04 · 1223 阅读 · 0 评论 -
pandas中groupby和pivot_table(数据透视表)
pivot_table(数据透视表)可以看做是一种高级的groupby功能,下面贴两段代码比较一下:df=pd.read_csv('2016_sale.csv')a=pd.pivot_table(df,index=['Category','Buyer','Product'],values=['Qty','Amount'],aggfunc={'Qty':(np.sum),'Amount'原创 2016-12-16 15:31:33 · 6166 阅读 · 0 评论 -
sklean中kmeans初始聚类点的选择
sklean的默认参数一般效果已经不错了,不过今天碰到一个案例需要手动调一下初始聚类点的情况。#overduetimes_predicted=KMeans(n_clusters=3).fit(X).predict(X) #不选择初始聚类点的情况overduetimes_predicted=KMeans(n_clusters=3,n_init=1,init=np.array([[原创 2017-03-09 10:27:01 · 3876 阅读 · 0 评论 -
Python_Statsmodels包_时间序列分析_ARIMA模型
基础库: pandas,numpy,scipy,matplotlib,statsmodels :from __future__ import print_functionimport pandas as pdimport numpy as npfrom scipy import statsimport matplotlib.pyplot as pltimport stat原创 2016-07-20 10:07:24 · 96672 阅读 · 84 评论 -
一个python替换字符串的函数
def replace_words(text, word_dic): yo = re.compile('|'.join(map(re.escape, word_dic))) def translate(mat): return word_dic[mat.group(0)] return yo.sub(translate, te原创 2017-06-02 13:07:18 · 748 阅读 · 0 评论 -
一个挺好的python中文分词库jieba
import jiebaa='我们中出了一个叛徒'a=str(list(jieba.cut(str(a))))print(a)['我们', '中出', '了', '一个', '叛徒']默认的效果就不错,还可以自定义字典,官方文档:http://www.oschina.net/p/jieba?fromerr=haNJ6oh4原创 2017-07-17 17:17:04 · 4711 阅读 · 2 评论