Jupyter杀手:新型的免费数据科学笔记本Deepnote

2020-02-27T15:44:38.png

DeepNote是一个位于旧金山的小型团队开发的工具,希望在数据科学工作流程中取代Jupyter。如果您是一名数据科学工作者,那么您可能会花更多的时间在工程任务上而不是实际研究上。安装库,管理数据库,跟踪实验,调试代码,用尽内存……我想您应该明白了或者经历过这些挑战和繁琐。

Jupyter笔记本非常适合数据科学原型设计。在单个环境中,可以无缝执行探索性分析,可视化数据并构建ML模型原型。
话虽这么说,不久之前大多数数据科学家还都认为Spyder IDE是万能的,后来人们逐渐发现它缺乏持续支持,没有合适的第三方集成机制等原因,所以即便它是最强大的工具,但最终也会被其他更适合数据科学工作者的产品所取代。

尽管Jupyter笔记本在数据科学界大受欢迎,但许多人也指出了一些重要的弱点。DeepNote这一新工具能够以更好或更快的方式解决现有工具中的弱点,这种能力通常可以使新工具在现状工具集中获得更多青睐。让我们看一下DeepNote提供的一些令人兴奋的差异化功能特性。

实时协作

Google的在线协作工具套件(文档,表格,幻灯片等)在没有许多附加功能的情况下,极大地蚕食了Microsoft Office的市场份额。他们是如何做到的呢?实时协作是让它跳出通往成功之门的主要差异。
通过与Google套件中的同事进行实时协作,您不再需要步调一致地进行工作,也不必为合并差异而烦恼。此外,您总是知道您的协作者当前在哪里工作,这使工作分工更加容易。
DeepNote可以立即使用此功能,从而可以在共享计算环境中实现无缝协作。确实,这确实带来了您周围的名称空间变化的问题。但是,我想这比必须共享需要重新运行以获取给定状态的Jupyter笔记本要面对的问题要好得多。

此外,DeepNote为每个协作者提供了各种权限级别:查看,执行,编辑,管理和所有者。这样可以对操作这些笔记本进行大量控制。
首先,对师生情景进行成像。在线课程的讲师可以浏览与虚拟教室共享的笔记本。讲师拥有管理员/所有者权限,而教室的其余部分仅包含查看权限。
再举一个例子,考虑一个高级人员来审查团队成员的工作。团队成员使用所有者权限来完全控制笔记本。上级使用编辑权限提供内联反馈,但不能执行任何单元。通过仅保留团队成员的执行权限,上级不能更改(读取:污染)团队成员的名称空间。

变量浏览器

我在Jupyter笔记本电脑中真正想念的Spyder IDE的一个方面(至少没有扩展名/小部件)是一个易于访问的命名空间资源管理器。当然,有who/ whosmagic命令。但是,这些并不能与Spyder的产品相提并论。
再次,我们有DeepNote填补了空白!

2020-02-27T15:49:42.png
图:DeepNote笔记本提供变量的精美摘要

除了可靠的变量浏览器之外,如果没有漂亮的熊猫DataFrame显示器,任何自尊的笔记本电脑环境都是不完整的。

2020-02-27T15:49:31.png
图:DeepNote笔记本也具有漂亮的熊猫DataFrame显示器

DeepNote附加到云硬件

我敢肯定,您已经听说过一条经验法则(实际上更多的是抱怨),大约80%的数据科学是数学和统计以外的所有内容。在云计算设置中,该比率变得更像是90/10,而将正确的计算能力配置到笔记本电脑下面则浪费了10%的时间。

2020-02-27T15:49:15.png
图:轻松查看并选择笔记本计算机在哪种硬件上运行

DeepNote了解您的痛苦,并提供对基于云的硬件的无缝访问,以满足您的各种需求。所谓无缝,是指您在笔记本界面本身中进行了所有设置!哦,顺便说一句,除非内核实际上处于空闲状态,否则它们不会关闭内核。

Python软件包管理

Python具有出色的软件包管理系统。DeepNote意识到了这一点,并遵守requirements.txt其工作目录中的文件。即使这样,仍然很容易忘记预先安装一些依赖项。发生这种情况时,我们只有在尝试导入并失败后才意识到遗漏!
为此,DeepNote的笔记本将主动监视软件包的导入,并通知您声明的要求中缺少的依赖项。另外,如果需求文件尚不存在,则可以最好地猜测该文件应该是什么。(剧透警报:猜测通常是正确的。)

2020-02-27T15:48:46.png
图:DeepNote软件包管理器建议安装缺少的依赖项

DeepNote与…集成在一起

2020-02-27T15:48:31.png
图:创建新项目的示例

最后,DeepNote提供了您几乎希望使用的所有集成。为了使笔记本的所有内容保持井井有条,您可以从各种连接中选择源控制存储库。这可以在笔记本创建以及写回更新时使用。
除了源代码控制,DeepNote笔记本还允许连接到云计算数据存储,例如S3,GCS和通用数据库引擎。

2020-02-27T15:47:41.png
图:正式连接到各种云基础架构


尽管DeepNote还没有真正杀死Jupyter,但某些迹象确实存在。我很想看看他们如何继续!但是,不要只相信我的话。您注册他们的抢先体验计划。他们在一周之内做出了回应,从那以后我们就一直在随意讨论改进之处!不要仅仅抱怨现状,而应该改善现状。

原创文章,作者:xgl,如若转载,请注明出处:https://edgeaitech.com/p/136

发表评论

登录后才能评论