数据分析
文章平均质量分 84
数据湖开发者社区
这个作者很懒,什么都没留下…
展开
-
自然语言处理入门指北 之 one-hot
自然语言(Natural Language)通常是指一种自然地随文化演化的语言,例如,汉语、英语、日语都是自然语言的例子。与编程语言等为计算机而设的“人造”语言相对,自然语言无法直接被计算机等“理解”,在这个前提下,如何让计算机认识、学习乃至理解自然语言就成了一个重要的研究方向:自然语言处理( Natural Language Processing, NLP) 。简而言之,自然语言处理旨在人与机器的直接通信,这需要一个复杂的系统做支撑,尤其是该系统必须能够正确的“表示”自然语言。以汉字为例,虽.原创 2021-08-09 09:57:05 · 393 阅读 · 0 评论 -
用pandas进行数据分析实战
安装pandas模块包,载入练习数据。在pandas中,常用的载入函数是read_csv。除此之外还有read_excel和read_table,table可以读取txt。若是服务器相关的部署,则还会用到read_sql,直接访问数据库,但它必须配合mysql相关包。read_csv拥有诸多的参数,encoding是最常用的参数之一,它用来读取csv格式的编码。这里使用了gb2312,该编码常见于windows,如果报错,可以尝试utf-8。sep参数是分割符,有些csv文件用逗号分割列,有些是原创 2021-07-26 15:23:02 · 1443 阅读 · 0 评论