Google Colaboratory是一个基于云端的Jupyter笔记本环境,允许用户在浏览器中编写和执行Python代码,免费使用GPU和TPU资源。
Google Colab是一个基于云端的Jupyter笔记本环境,允许用户在浏览器中编写和执行Python代码,无需配置即可免费使用GPU和TPU资源。
由Andrew Ng创建的机器学习专项课程,面向初学者的AI职业入门课程,通过直观的视觉方法教授基础AI概念。
一个PyTorch分布式训练库,只需添加四行代码即可在任何分布式配置上运行相同的PyTorch代码,实现简单、高效和适应性强的规模化训练和推理。
TRL是一个完整的堆栈库,提供训练Transformer语言模型的工具集,支持SFT、DPO、PPO等多种强化学习方法,并与Hugging Face transformers集成。
Hugging Face Tokenizers是一个快速、先进的标记化工具库,专为研究和生产环境优化,提供当今最常用的标记化器实现。
Hugging Face Hub的Python客户端库,用于与Hugging Face Hub机器学习平台进行交互,支持模型、数据集和Spaces的管理和操作。
Hugging Face Transformers是一个用于文本、计算机视觉、音频、视频和多模态模型的最先进机器学习模型定义框架,支持推理和训练。
TorchMetrics是一个包含100+ PyTorch指标实现的集合库,提供标准化接口以减少代码重复,支持分布式训练和自动批处理累积。
Lightning Fabric是一个快速轻量级的PyTorch模型扩展框架,只需5行代码即可将PyTorch代码转换为Fabric,并提供最先进的分布式训练功能。
NLTK是一个领先的Python自然语言处理平台,提供处理人类语言数据的工具和资源,包括文本分类、分词、词性标注、句法分析等功能。
TensorFlow Probability是一个基于TensorFlow构建的Python库,用于概率推理和统计分析,支持在现代硬件上结合概率模型和深度学习。
Yellowbrick是一个基于Scikit-Learn的机器学习可视化库,扩展了Scikit-Learn API,使模型选择和超参数调优更加容易。
Apache Airflow是一个由社区创建的平台,用于以编程方式编写、调度和监控工作流。它是一个开源的工作流编排工具,专为数据工程和机器学习管道设计。
DVC是一个易于使用的Git扩展,专门为数据科学家提供数据版本控制功能,帮助管理数据科学工作流程中的数据版本控制。
Keras Recommenders是基于Keras 3构建推荐系统的库,支持TensorFlow、JAX和PyTorch,提供完整的推荐系统工作流程构建模块。
scikit-learn是Python中最流行的机器学习库,提供简单高效的数据预测分析工具,基于NumPy、SciPy和matplotlib构建。
TensorFlow Datasets是TensorFlow官方提供的一系列现成的机器学习数据集,支持TensorFlow、Jax等Python机器学习框架。