Python 生态系统提供了很多非常棒的数据科学开发工具:
借助这些工具可以很容易地使用强大的模型,比如线性回归和 SVM。
Docker 运行时
Grid Studio 运行在 Docker 容器中,可以很方便地访问 UNIX 环境(甚至是 Windows!)中的东西:Python、scikit-learn、numpa、pandas、terminal、wget、zip,等等。
Grid Studio 提供了预先构建好的 Docker 镜像,可以通过简单的命令行来启动。
数据可视化
数据可视化是数据科学的一项常见任务。Grid Studio 与 Plotly.js 和 Matplotlib 深度集成,为高级数据可视化提供了内置支持。
为了演示 Grid Studio 的功能,接下来将提供一些具体的例子。
示例:爬取网络内容
之前爬取网络内容可能需要在各种工具之间切换,现在只需要一个脚本就够了。
在上面的示例中,一个简短的脚本直接将 Hacker News 网站的文章加载到表格中。
脚本地址:
https://github.com/ricklamers/gridstudio/blob/master/examples/scrape.py
示例:估计正态分布
这个例子演示了使用 Plotly.js 进行高保真正态分布估计,交互式绘图让你对正在发生的事情一目了然。
脚本地址:
https://github.com/ricklamers/gridstudio/blob/master/examples/estimate_normal.py
开源动机
虽然最初 Rick 想将这个工具打造成一个商业项目,但最后还是决定将其开源,让每个人都能使用它,并有可能由来自社区的一小批数据爱好者负责开发。
在开发这个工具的初期,他发现有很多项目都提供了类似的功能。
首先,有一个叫作 xlwings 的插件将 Python 直接集成到 Excel 中。尽管它并不是真的将电子表格和 Python 集成到单个产品中,但确实为用户提供了一个完整的 Excel 开发环境。
其次,Python 已经从 IPython 转向了 Jupyter Notebooks,为数据科学家提供了一个很好的开发环境。虽然它仍然缺乏电子表格功能,但对于初级数据科学家来说仍然很有吸引力。
总的来说,如果把 Grid Studio 做成商业项目,它就要与这些开源产品展开竞争,这样在价格上就不会有任何优势。Rick 坚信 Grid Studio 提供了一些独特的功能,在某些场景下会成为不二之选。
Grid Studio 的项目地址:
https://github.com/ricklamers/gridstudio。
开发者评价
东西好不好,开发者最知道。
Bruh, this is amazing. You should sell this shit are you kidding me?!
兄弟,这也太牛了,你应该把这玩意儿卖钱啊,(开源)是在逗我?
As a heavy excel user who despises vba, this looks amazing
作为一个鄙视 VBA 的 Excel 重度用户,这也太牛了吧
I showed this to my brother, who’s not a programmer, and he said “holy shit!”. Well, it’s impressive. Good job!
我把这个给我不是程序员的哥哥看,他说:我去,太牛了,干得漂亮!
除了整齐划一的 wow awesome、amazing 的赞叹,开发者们同样提出了很多改进意见,并且表示可以加入社区一起优化这个工具。版本和开发计划 Grid Studio 现在就可以从 GitHub 上下载了。
-
增加更多原生函数(比如 AVERAGE、SUM、IF 之外),甚至是来自 Libre Office Calc 或 Excel 的函数。
-
在表格中输入公式时提供语法高亮和函数提示。
-
高级排序和过滤功能。
-
扩展控件,使用 Plotly.js 进行交互式可视化。
-
更容易地分享工作空间或代码(比如导出工作空间)。
-
实时协作(这个可能会很困难)。
-
提供插件 API 或接口。
-
将公式解析器升级成真正的基于语法的解析器。
-
Python 语法自动完成。
-
性能优化。
-
与 Python 更健壮地集成(不会出现字符、语句断开)。
如何使用 Grid Studio?
在本地安装 Grid Studio(确保已经安装了 Docker):
- 克隆代码库:git clone
https://github.com/ricklamers/gridstudio
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、全套PDF电子书
书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。
四、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
五、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!