XGBoost是一个优化的分布式梯度提升库,设计为高效、灵活且可移植的机器学习算法库,在梯度提升框架下实现机器学习算法。

LightGBM是一个基于梯度提升决策树的机器学习框架,具有训练速度快、内存占用低、准确率高、支持并行和分布式学习等优势。

Yellowbrick是一个基于Scikit-Learn的机器学习可视化库,扩展了Scikit-Learn API,使模型选择和超参数调优更加容易。

ELI5是一个Python库,用于可视化和调试各种机器学习模型,提供统一的API来解释黑盒模型。

DVC是一个易于使用的Git扩展,专门为数据科学家提供数据版本控制功能,帮助管理数据科学工作流程中的数据版本控制。

MLflow是一个开源的开发者平台,用于构建AI应用程序和模型,提供端到端的可观测性、评估和跟踪功能。

Apache Airflow是一个由社区创建的平台,用于以编程方式编写、调度和监控工作流。它是一个开源的工作流编排工具,专为数据工程和机器学习管道设计。

Dagster是一个现代化的数据编排平台,为团队构建、扩展和监控AI与数据管道提供统一控制平面。

Panel是一个开源的Python库,专为简化强大的数据工具、仪表板和复杂应用程序的开发而设计,完全在Python环境中运行。

Voilà是一个开源工具,可以将Jupyter Notebook转换为交互式Web应用程序和仪表板,支持安全定制和分享。

Ray是一个AI计算引擎,用于扩展机器学习、AI计算和分布式Python应用,支持从笔记本电脑到数千个GPU的任意规模扩展。

pyjanitor是一个Python数据清洗工具,提供简洁易用的API来扩展pandas功能,实现高效的数据预处理和清洗操作。

开源软件、开放标准和Web服务,支持跨所有编程语言的交互式计算,提供JupyterLab和Jupyter Notebook等开发环境。

Matplotlib是一个用于在Python中创建静态、动画和交互式可视化的综合库,使简单的事情变得容易,困难的事情变得可能。

Vega-Altair是一个用于Python的声明式可视化库,基于强大的Vega-Lite语法构建,提供简单友好的API,让用户花更少时间编写代码,更多时间探索数据。

spaCy是一个工业级的Python自然语言处理库,专注于大规模信息提取任务,具有高性能和易用性特点。

Dash Enterprise是一个用于构建、托管和部署Dash应用程序的企业级数据应用平台,专为Python开发者设计。

xtensor-python是xtensor C++多维数组库的Python绑定,支持numpy风格的广播和惰性计算,实现C++和Python之间的无缝互操作。

Awkward Array是一个用于处理嵌套、可变大小数据的Python库,支持任意长度列表、记录、混合类型和缺失数据,使用NumPy风格的语法。

uarray是一个Python后端系统,允许定义API以及包含该API单独实现的后端,主要用于数组计算和NumPy API的通用后端调度机制。