Yellowbrick是一个基于Scikit-Learn的机器学习可视化库,扩展了Scikit-Learn API,使模型选择和超参数调优更加容易。
DVC是一个易于使用的Git扩展,专门为数据科学家提供数据版本控制功能,帮助管理数据科学工作流程中的数据版本控制。
Apache Airflow是一个由社区创建的平台,用于以编程方式编写、调度和监控工作流。它是一个开源的工作流编排工具,专为数据工程和机器学习管道设计。
Vega-Altair是一个用于Python的声明式可视化库,基于强大的Vega-Lite语法构建,提供简单友好的API,让用户花更少时间编写代码,更多时间探索数据。
xtensor-python是xtensor C++多维数组库的Python绑定,支持numpy风格的广播和惰性计算,实现C++和Python之间的无缝互操作。
Awkward Array是一个用于处理嵌套、可变大小数据的Python库,支持任意长度列表、记录、混合类型和缺失数据,使用NumPy风格的语法。