自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 pandas处理csv文件

import pandas as pdimport randomimport numpy as npfirst = pd.read_csv(r"/file",usecols=[1])first.drop_duplicates(inplace=True)#first = np.ndarray(first[:,0])#print(type(first))second = [random.randint(1,10) for i in range(0,1000000)]third = [rando

2020-06-18 22:02:34 196

原创 离散编码问题,LabelEncoder和OneHotEncoder

在id处理与nlp处理中,离散编码的处理比较重要。可以考虑用sklearn库LableEncoder,而涉及到01编码或多重属性编码时用OneHotEncoderimport pandas as pdfrom sklearn.preprocessing import LabelEncoderdata=pd.DataFrame({'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]})for i in data: try: data[i]=L

2020-05-23 18:29:09 259

原创 离散编码问题,LabelEncoder和OneHotEncoder

import pandas as pdfrom sklearn.preprocessing import LabelEncoderdata=pd.DataFrame({'A':[1,2,3,4],'B':[5,6,7,8],'C':[9,10,11,12]})for i in data: try: data[i]=LabelEncoder().fit_transform(apply(int))#transform操作就是转为数字表示形式。 except:

2020-05-23 15:18:36 322

原创 编码问题

import jsonimport codecsd =dict(name=['书', '书包', '书本'], age=[20,77,9], score=[6,8,88])f =open('./sentence.txt', 'w')json.dump(d,f)f.close()g=open('./sentence.txt', 'rb')e=json.load(g)print(e)from gensim.models import Word2Vecwith codecs.open('./s

2020-05-23 09:47:30 213

原创 队列和栈分别的应用

栈:括号匹配、算符优先算法求表达式的值、表达式的括号匹配问题、迷宫求解、进制转换、计算器、深度优先的非递归遍历、子程序与函数的调用和返回、数字转字符,表达式求值、中断时数据保存和返回。队列:广度优先层次遍历、进程调度、用户文件访问...

2020-05-21 21:31:02 690

原创 pycharm debug

debug中step into、step out显示灰色的原因:①未断点过变量,无变量生成;②数据庞大,需要等待时间;③打开多个文件,需在某文件内部debug。

2020-05-21 13:30:11 333

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除