python
入门小站
这个作者很懒,什么都没留下…
展开
-
Pandas入门教程(六)
import pandas as pdgl=pd.read_csv('./pandas/data/game_logs.csv')# 数据的内存使用情况gl.info(memory_usage='deep')<class 'pandas.core.frame.DataFrame'>RangeIndex: 171907 entries, 0 to 171906Columns: 161 entries, date to acquisition_infodtypes: float64(原创 2020-10-05 23:37:11 · 249 阅读 · 0 评论 -
Pandas入门教程(五)
import pandas as pdimport numpy as np# 折线图s=pd.Series(np.random.randn(10),index=np.arange(0,100,10))s.plot()<AxesSubplot:>df=pd.DataFrame(np.random.randn(10,4),index=np.arange(0,100,10),columns=list('ABCD'))print(df)df.plot() A原创 2020-09-29 16:03:07 · 357 阅读 · 0 评论 -
Pandas入门教程(四)
groupby分组import pandas as pdimport numpy as npdf=pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'on原创 2020-09-28 21:44:36 · 199 阅读 · 0 评论 -
Pandas入门教程(三)
时间格式化和时间查询import pandas as pddate=pd.Timestamp('2020/09/27 13:30:00')print(date)2020-09-27 13:30:00#年print(date.year)#月print(date.month)#日print(date.day)#时print(date.hour)#分print(date.minute)#秒print(date.second)202092713300#加5天d原创 2020-09-27 21:49:05 · 322 阅读 · 0 评论 -
Pandas入门教程(二)
merge合并DataFrameimport pandas as pdleft=pd.DataFrame({ 'key':['k0','k1','k2','k3','k4','k5'], 'A':['A0','A1','A2','A3','A4','A5'], 'B':['B0','B1','B2','B3','B4','B5']})right=pd.DataFrame({ 'key':['k0','k1','k2','k3','k4','k5'], '原创 2020-09-26 22:43:44 · 168 阅读 · 0 评论 -
Pandas入门教程(一)
数据分析处理库import pandas as pddf=pd.read_csv("./pandas/data/titanic.csv")df.head(N) 读取数据的前N行df.head(6)df.info() 获取DataFrame的简要摘要df.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 891 entries, 0 to 890Data columns (total 12 columns): #原创 2020-09-25 22:36:04 · 376 阅读 · 0 评论 -
结巴(jieba)分词器入门
安装jieba# pip install jieba分词工具import jiebainput="我来到北京大学"seg_list=jieba.cut(input)print("默认精确模式:"+"/".join(seg_list))seg_list=jieba.cut(input,cut_all=True)print("全模式:"+"/".join(seg_list))默认精确模式:我/来到/北京大学全模式:我/来到/北京/北京大学/大学导入自定义的字典# 不导入自定义的字典原创 2020-09-23 22:30:12 · 421 阅读 · 0 评论 -
Spacy简单入门
安装Spacypip install spacy导入工具包和英文模型#python -m spacy download en文本处理import spacynlp=spacy.load('en')#分词doc=nlp('Weather is good, very windy and sunny. We have no classes in the afternoon.')for token in doc: print(token)#分句for sent in doc.sen原创 2020-09-21 23:31:13 · 1877 阅读 · 5 评论 -
NLTK简单入门和数据清洗
NLTK历史悠久的英文分词工具# 导入分词模块from nltk.tokenize import word_tokenizefrom nltk.text import Textinput='''There were a sensitivity and a beauty to her that have nothing to do with looks. She was one to be listened to, whose words were so easy to take to heart原创 2020-09-20 20:12:08 · 559 阅读 · 0 评论 -
Python3常用正则表达式
正则表达式速查表字符描述\将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“n“匹配字符”n“。”\n“匹配一个换行符。串行”\\“匹配”\“而”\(“则匹配”(“。^匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n“或”\r“之后的位置。$匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n“或”\r“之前的位置。*匹配前面的子表达式原创 2020-09-17 23:44:57 · 179 阅读 · 0 评论 -
Python3常用字符串操作
1. str.strip去掉字符串首位指定的字符,默认去掉空白字符intput=" nnn入门小站nnn "print('[%s]' % input)# strip不会改变原字符串的值,所以需要一个新变量接收newInput=input.strip()print('[%s]' % newInput)# 去掉首位的n字符print('[%s]' % input.strip('n'))# 去掉首位的n字符+空白字符print('[%s]' % input.strip('n').strip())原创 2020-09-16 21:58:56 · 282 阅读 · 0 评论