python
|bugbugbug|
这个作者很懒,什么都没留下…
展开
-
python DataFrame把两列的值对应起来变成新的列,或把列值中的字典展开为新列
把列值中的字典展开为新列 原始的DataFrame如下: df = pd.DataFrame([[1,'a',{'a':'vv','b':'cc'}],[2,'b',{'c':'vv','b':'cc'}], [3,'c',{'b':'cc'}], [4,'n',{'a':'cc'}]], columns =['id', 'prop', 'value']) 把‘value’转换为list后再变成DataFrame即可: pd.DataFrame(list(df['value'])) 把两列的值对.原创 2021-07-11 21:57:38 · 2467 阅读 · 0 评论 -
python获取dataframe的index
原创 2018-10-30 10:53:36 · 66753 阅读 · 5 评论 -
python 归一化
有现成的工具, # 有目标数组x from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() x= scaler.fit_transform(x) 即可把数组x中的值归一化。原创 2018-11-14 16:48:42 · 1063 阅读 · 0 评论 -
读写csv乱码
DataFrame 转存为csv尝试使用: df.to_csv(“output.csv”,encoding=“utf_8_sig”) 度csv尝试使用: df = pd.read_csv(‘input.csv’, encoding = ‘ANSI’)原创 2018-11-15 11:45:52 · 255 阅读 · 0 评论 -
自然语言处理(NLP)-----文本分类、文本生成实践(学习笔记)
本文是基于 Emmanuel Ameisen 的 Concrete solutions to real problems的学习笔记(翻译+整理+扩充),代码部分根据自己的环境进行了微改。此笔记适用于对于机器学习和Python应用有基本了解的人。本人环境是python3.6。本程序基于jupyter notebook。 目前现存很多NLP的技术与工具,但聚类和分类永远是我们在面对这类问题时会首先考虑...翻译 2019-05-08 10:48:09 · 7245 阅读 · 0 评论 -
Win7,Python3链接hive的各种问题(impyla)
pip install sasl error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools 此错误需要安装Visual Studio 安装地址: ht...原创 2019-05-23 15:10:34 · 1583 阅读 · 0 评论