Ray是一个AI计算引擎,用于扩展机器学习、AI计算和分布式Python应用,支持从笔记本电脑到数千个GPU的任意规模扩展。

pyjanitor是一个Python数据清洗工具,提供简洁易用的API来扩展pandas功能,实现高效的数据预处理和清洗操作。

开源软件、开放标准和Web服务,支持跨所有编程语言的交互式计算,提供JupyterLab和Jupyter Notebook等开发环境。

Matplotlib是一个用于在Python中创建静态、动画和交互式可视化的综合库,使简单的事情变得容易,困难的事情变得可能。

Vega-Altair是一个用于Python的声明式可视化库,基于强大的Vega-Lite语法构建,提供简单友好的API,让用户花更少时间编写代码,更多时间探索数据。

spaCy是一个工业级的Python自然语言处理库,专注于大规模信息提取任务,具有高性能和易用性特点。

Dash Enterprise是一个用于构建、托管和部署Dash应用程序的企业级数据应用平台,专为Python开发者设计。

xtensor-python是xtensor C++多维数组库的Python绑定,支持numpy风格的广播和惰性计算,实现C++和Python之间的无缝互操作。

Awkward Array是一个用于处理嵌套、可变大小数据的Python库,支持任意长度列表、记录、混合类型和缺失数据,使用NumPy风格的语法。

uarray是一个Python后端系统,允许定义API以及包含该API单独实现的后端,主要用于数组计算和NumPy API的通用后端调度机制。

TensorLy是一个用于Python的张量学习库,提供快速简单的张量操作、分解和回归功能,支持多种深度学习框架后端。

Python-Blosc2是一个高性能的数据压缩和计算库,提供先进的压缩算法和N维数组操作功能,专为大数据处理而设计。

Intake是一个开源数据访问和分发工具,用于简化数据基础设施,支持数据集的描述、编目、搜索和加载。

Dask是一个用于Python的并行计算库,可以轻松扩展Python工具来处理大规模数据,比Spark更快更简单。

CuPy是一个开源的GPU加速计算数组库,提供与NumPy和SciPy高度兼容的接口,用于Python中的GPU加速计算。

JAX是一个用于加速器导向数组计算和程序转换的Python库,专为高性能数值计算和大规模机器学习设计。

Apache Arrow是一个通用的列式内存格式和多语言工具箱,用于快速数据交换和内存分析

GeoPandas是一个开源项目,旨在简化Python中地理空间数据的处理,扩展了pandas的数据类型以支持几何类型的空间操作。

Folium是一个基于Python的数据可视化库,利用Leaflet.js创建交互式地图,将Python数据处理与地图可视化相结合。

COMPAS是一个面向建筑、工程、制造和建造领域的计算框架,用于研究和协作的开源平台。