python入门|20年的大佬私藏的python库大全

技术文章

环境管理

管理 Python 版本和环境的工具

p:非常简单的交互式 python 版本管理工具。

pyenv:简单的 Python 版本管理工具。

Vex:可以在虚拟环境中执行命令。

virtualenv:创建独立 Python 环境的工具。

virtualenvwrapper:virtualenv 的一组扩展。

分发

打包为可执行文件以便分发。

PyInstaller:将 Python 程序转换成独立的执行文件(跨平台)。

dh-virtualenv:构建并将 virtualenv 虚拟环境作为一个 Debian 包来发布。

Nuitka:将脚本、模块、包编译成可执行文件或扩展模块。

py2app:将 Python 脚本变为独立软件包(Mac OS X)。

py2exe:将 Python 脚本变为独立软件包(Windows)。

pynsist:一个用来创建 Windows 安装程序的工具,可以在安装程序中打包 Python本身。

将源码编译成软件。

buildout:一个构建系统,从多个组件来创建,组装和部署应用。

fabricate:对任何语言自动找到依赖关系的构建工具。

PlatformIO:多平台命令行构建工具。

PyBuilder:纯 Python 实现的持续化构建工具。

SCons:软件构建工具。

交互式解析器

交互式 Python 解析器。

IPython:功能丰富的工具,非常有效的使用交互式 Python。

bpython:界面丰富的 Python 解析器。

ptpython:高级交互式Python解析器, 构建于python-prompt-toolkit 之上。

文件

文件管理和 MIME(多用途的网际邮件扩充协议)类型检测。

imghdr:(Python 标准库)检测图片类型。

mimetypes:(Python 标准库)将文件名映射为 MIME 类型。

path.py:对 os.path 进行封装的模块。

pathlib:(Python3.4+ 标准库)跨平台的、面向对象的路径操作库。

python-magic:文件类型检测的第三方库 libmagic 的 Python 接口。

Unipath:用面向对象的方式操作文件和目录。

watchdog:管理文件系统事件的 API 和 shell 工具。

通用

chardet:字符编码检测器,兼容 Python2 和 Python3。

difflib:(Python 标准库)帮助我们进行差异化比较。

ftfy:让Unicode文本更完整更连贯。

fuzzywuzzy:模糊字符串匹配。

Levenshtein:快速计算编辑距离以及字符串的相似度。

pangu.py:在中日韩语字符和数字字母之间添加空格。

yfiglet-figlet:pyfiglet -figlet 的 Python实现。

shortuuid:一个生成器库,用以生成简洁的,明白的,URL 安全的 UUID。

unidecode:Unicode 文本的 ASCII 转换形式 。

uniout:打印可读的字符,而不是转义的字符串。

xpinyin:一个用于把汉字转换为拼音的库。

simplejson:Python的JSON编码、解码器。

Slug化

awesome-slugify:一个 Python slug 化库,可以保持 Unicode。

python-slugify:Python slug 化库,可以把 unicode 转化为 ASCII。

unicode-slugify:一个 slug 工具,可以生成 unicode slugs ,需要依赖 Django 。

解析器

phonenumbers:解析,格式化,储存,验证电话号码。

PLY:lex 和 yacc 解析工具的 Python 实现。

Pygments:通用语法高亮工具。

pyparsing:生成通用解析器的框架。

python-nameparser:把一个人名分解为几个独立的部分。

python-user-agents:浏览器 user agent 解析器。

sqlparse:一个无验证的 SQL 解析器。

特殊文本格式处理

一些用来解析和操作特殊文本格式的库。

PDF

PDFMiner:一个用于从PDF文档中抽取信息的工具。

PyPDF2:一个可以分割,合并和转换 PDF 页面的库。

ReportLab:快速创建富文本 PDF 文档。

Markdown

Mistune:快速并且功能齐全的纯 Python 实现的 Markdown 解析器。

Python-Markdown:John Gruber’s Markdown 的 Python 版实现。

Python-Markdown2:纯 Python 实现的 Markdown 解析器,比 Python-Markdown 更快,更准确,可扩展。

PyYAML:Python 版本的 YAML 解析器。

CSV

csvkit:用于转换和操作 CSV 的工具。

Archive

unp:一个用来方便解包归档文件的命令行工具。

自然语言处理

用来处理人类语言的库。

NLTK:一个先进的平台,用以构建处理人类语言数据的 Python 程序。

jieba:中文分词工具。

langid.py:独立的语言识别系统。

Pattern:Python 网络信息挖掘模块。

SnowNLP:一个用来处理中文文本的库。

TextBlob:为进行普通自然语言处理任务提供一致的 API。

TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。

cement:Python 的命令行程序框架。

click:一个通过组合的方式来创建精美命令行界面的包。

cliff:一个用于创建命令行程序的框架,可以创建具有多层命令的命令行程序。

clint:Python 命令行程序工具。

colorama:跨平台彩色终端文本。

docopt:Python 风格的命令行参数解析器。

Gooey:一条命令,将命令行程序变成一个 GUI 程序。

python-prompt-toolkit:一个用于构建强大的交互式命令行程序的库。

Pythonpy:在命令行中直接执行任何Python指令。

下载器

用来进行下载的库.

s3cmd:一个用来管理Amazon S3 和 CloudFront 的命令行工具。

s4cmd:超级 S3 命令行工具,性能更加强劲。

you-get:一个 YouTube/Youku/Niconico 视频下载器,使用 Python3 编写。

youtube-dl:一个小巧的命令行程序,用来下载 YouTube 视频。

OCR

光学字符识别库。

pyocr:Tesseract 和 Cuneiform 的一个封装(wrapper)。

pytesseract:Google Tesseract OCR 的另一个封装(wrapper)。

python-tesseract – Google Tesseract OCR 的一个包装类。

Video

用来操作视频和GIF的库。

moviepy:一个用来进行基于脚本的视频编辑模块,适用于多种格式,包括动图 GIFs。

scikit-video:SciPy 视频处理常用程序。

地理位置

地理编码地址以及用来处理经纬度的库。

GeoDjango:世界级地理图形 web 框架。

GeoIP:MaxMind GeoIP Legacy 数据库的 Python API。

geojson:GeoJSON 的 Python 绑定及工具。

geopy:Python 地址编码工具箱。

pygeoip:纯 Python GeoIP API。

django-countries:一个 Django 应用程序,提供用于表格的国家选择功能,国旗图标静态文件以及模型中的国家字段。

使用HTTP的库。

requests:人性化的HTTP请求库。

grequests:requests 库 + gevent ,用于异步 HTTP 请求.

httplib2:全面的 HTTP 客户端库。

treq:类似 requests 的Python API 构建于 Twisted HTTP 客户端之上。

urllib3:一个具有线程安全连接池,支持文件 post,清晰友好的 HTTP 库。

数据库

Python实现的数据库。

pickleDB:一个简单,轻量级键值储存数据库。

PipelineDB:流式 SQL 数据库。

TinyDB:一个微型的,面向文档型数据库。

ZODB:一个 Python 原生对象数据库。一个键值和对象图数据库。

数据库驱动

用来连接和操作数据库的库。

MySQL:awesome-mysql系列

mysql-python:Python 的 MySQL 数据库连接器。

ysqlclient:mysql-python 分支,支持 Python 3。

oursql:一个更好的 MySQL 连接器,支持原生预编译指令和 BLOBs.

PyMySQL:纯 Python MySQL 驱动,兼容 mysql-python。

PostgreSQL

psycopg2:Python 中最流行的 PostgreSQL 适配器。

queries:psycopg2 库的封装,用来和 PostgreSQL 进行交互。

txpostgres:基于 Twisted 的异步 PostgreSQL 驱动。

apsw:另一个 Python SQLite封装。

dataset:在数据库中存储Python字典

pymssql:一个简单的Microsoft SQL Server数据库接口。

NoSQL 数据库

cassandra-python-driver:Cassandra 的 Python 驱动。

HappyBase:一个为 Apache HBase 设计的,对开发者友好的库。

Plyvel:一个快速且功能丰富的 LevelDB 的 Python 接口。

py2neo:Neo4j restful 接口的Python 封装客户端。

pycassa:Cassandra 的 Python Thrift 驱动。

PyMongo:MongoDB 的官方 Python 客户端。

telephus:基于 Twisted 的 Cassandra 客户端。

txRedis:基于 Twisted 的 Redis 客户端。

实现对象关系映射或数据映射技术的库。

关系型数据库

Django Models:Django 的一部分。

SQLAlchemy:Python SQL 工具以及对象关系映射工具。

awesome-sqlalchemy系列

Peewee:一个小巧,富有表达力的 ORM。

PonyORM:提供面向生成器的 SQL 接口的 ORM。

python-sql:编写 Python 风格的 SQL 查询。

NoSQL 数据库

django-mongodb-engine:Django MongoDB 后端。

PynamoDB:Amazon DynamoDB 的一个 Python 风格接口。

flywheel:Amazon DynamoDB 的对象映射工具。

MongoEngine:一个Python 对象文档映射工具,用于 MongoDB。

hot-redis:为 Redis 提供 Python 丰富的数据类型。

redisco:一个 Python 库,提供可以持续存在在 Redis 中的简单模型和容器。

其他

butterdb:Google Drive 电子表格的 Python ORM。

Web 框架

全栈 Web 框架。

Django:Python 界最流行的 web 框架。

Flask:一个 Python 微型框架。

awesome-flask系列

pyramid:一个小巧,快速,接地气的开源Python web 框架。

awesome-pyramid系列

Bottle:一个快速小巧,轻量级的 WSGI 微型 web 框架。

CherryPy:一个极简的 Python web 框架,服从 HTTP/1.1 协议且具有WSGI 线程池。

TurboGears:一个可以扩展为全栈解决方案的微型框架。

web2py:一个全栈 web 框架和平台,专注于简单易用。

Tornado:一个web 框架和异步网络库。

权限

允许或拒绝用户访问数据或功能的库。

Carteblanche:Module to align code with thoughts of users and designers. Also magically handles navigation and permissions.

django-guardian:Django 1.2+ 实现了单个对象权限。

django-rules:一个小巧但是强大的应用,提供对象级别的权限管理,且不需要使用数据库。

CMS

内容管理系统

odoo-cms: 一个开源的,企业级 CMS,基于odoo。

djedi-cms:一个轻量级但却非常强大的 Django CMS ,考虑到了插件,内联编辑以及性能。

FeinCMS:基于 Django 构建的最先进的内容管理系统之一。

Kotti:一个高级的,Python 范的 web 应用框架,基于 Pyramid 构建。

Mezzanine:一个强大的,持续的,灵活的内容管理平台。

Opps:一个为杂志,报纸网站以及大流量门户网站设计的 CMS 平台,基于 Django。

Plone:一个构建于开源应用服务器 Zope 之上的 CMS。

Quokka:灵活,可扩展的小型 CMS,基于 Flask 和 MongoDB。

Wagtail:一个 Django 内容管理系统。

Widgy:最新的 CMS 框架,基于 Django。

Django

django-rest-framework:一个强大灵活的工具,用来构建 web API。

django-formapi:为 Django 的表单验证,创建 JSON APIs 。

Flask

flask-api:为 flask 开发的,可浏览 Web APIs 。

flask-restful:为 flask 快速创建REST APIs 。

flask-restless:为 SQLAlchemy 定义的数据库模型创建 RESTful APIs 。

eve:REST API 框架,由 Flask, MongoDB 等驱动。

Pyramid

cornice:一个Pyramid 的 REST 框架 。

与框架无关的

falcon:一个用来建立云 API 和 web app 后端的高性能框架。

sandman:为现存的数据库驱动系统自动创建 REST APIs 。

restless:框架无关的 REST 框架 ,基于从 Tastypie 学到的知识。

ripozo:快速创建 REST/HATEOAS/Hypermedia APIs。

验证

实现验证方案的库。

Jinja2:一个现代的,对设计师友好的模板引擎。

Chameleon:一个 HTML/XML 模板引擎。 模仿了 ZPT(Zope Page Templates), 进行了速度上的优化。

Genshi:Python 模板工具,用以生成 web 感知的结果。

Mako:Python 平台的超高速轻量级模板。

处理事件以及任务队列的库。

celery:一个异步任务队列/作业队列,基于分布式消息传递。

huey:小型多线程任务队列。

mrq:Mr. Queue -一个 Python 的分布式 worker 任务队列, 使用 Redis 和 gevent。

simpleq:一个简单的,可无限扩张的,基于亚马逊 SQS 的队列。

对数据进行索引和执行搜索查询的库和软件。

django-haystack:Django 模块化搜索。

elasticsearch-dsl-py:Elasticsearch 的官方高级 Python 客户端。

solrpy:solr的 Python 客户端。

Whoosh:一个快速的纯 Python 搜索引擎库。

动态消息

用来创建用户活动的库。

django-activity-stream:从你的站点行为中生成通用活动信息流。

Stream-Framework:使用 Cassandra 和 Redis 创建动态消息和通知系统。

管理、压缩、缩小网站资源的工具。

django-compressor:将链接和内联的 JavaScript 或 CSS 压缩到一个单独的缓存文件中。

django-storages:一个针对 Django 的自定义存储后端的工具集合。

fanstatic:打包、优化,并且把静态文件依赖作为 Python 的包来提供。

File Conveyor:一个后台驻留的程序,用来发现和同步文件到 CDNs, S3 和 FTP。

Flask-Assets:帮你将 web 资源整合到你的 Flask app 中。

jinja-assets-compressor:一个 Jinja 扩展,用来编译和压缩你的资源。

webassets:为你的静态资源打包、优化和管理生成独一无二的缓存 URL。

缓存

缓存数据的库。

Beaker:一个缓存和会话库,可以用在 web 应用和独立 Python脚本和应用上。

django-cacheops:具有自动颗粒化事件驱动失效功能的 ORM。

django-viewlet:渲染模板,同时具有额外的缓存控制功能。

dogpile.cache:dogpile.cache 是 Beaker 的下一代替代品,由同一作者开发。

HermesCache:Python 缓存库,具有基于标签的失效和 dogpile effect 保护功能。

johnny-cache:django应用缓存框架。

pylibmc:libmemcached 接口的 Python 封装。

HTML处理

处理 HTML和XML的库。

BeautifulSoup:以 Python 风格的方式来对 HTML 或 XML 进行迭代,搜索和修改。

bleach:一个基于白名单的 HTML 清理和文本链接库。

cssutils:一个 Python 的 CSS 库。

html5lib:一个兼容标准的 HTML 文档和片段解析及序列化库。

lxml:一个非常快速,简单易用,功能齐全的库,用来处理 HTML 和 XML。

MarkupSafe:为Python 实现 XML/HTML/XHTML 标记安全字符串。

pyquery:一个解析 HTML 的库,类似 jQuery。

untangle:将XML文档转换为Python对象,使其可以方便的访问。

xhtml2pdf:HTML/CSS 转 PDF 工具。

xmltodict:像处理 JSON 一样处理 XML。

数据验证

数据验证库。多用于表单验证。

Cerberus:A mappings-validator with a variety of rules, normalization-features and simple customization that uses a pythonic schema-definition.

colander:一个用于对从 XML, JSON,HTML 表单获取的数据或其他同样简单的序列化数据进行验证和反序列化的系统。

kmatch:一种用于匹配/验证/筛选 Python 字典的语言。

Schematics:数据结构验证。

valideer:轻量级可扩展的数据验证和适配库。官网

voluptuous:一个 Python 数据验证库。主要是为了验证传入 Python的 JSON,YAML 等数据。

反垃圾技术

帮助你和电子垃圾进行战斗的库。

django-simple-captcha:一个简单、高度可定制的Django 应用,可以为任何Django表单添加验证码。

django-simple-spam-blocker:一个用于Django的简单的电子垃圾屏蔽工具。

标记

用来进行标记的库。

django-taggit:简单的 Django 标记工具。

管理面板

管理界面库。

Ajenti:一个你的服务器值得拥有的管理面板。

django-suit:Django 管理界面的一个替代品 (仅对于非商业用途是免费的)。

django-xadmin:Django admin 的一个替代品,具有很多不错的功能。

flask-admin:一个用于 Flask 的简单可扩展的管理界面框架。官网

flower:一个对 Celery 集群进行实时监控和提供 web 管理界面的工具。

Grappelli:Django 管理界面的一个漂亮的皮肤。

静态站点生成器

静态站点生成器是一个软件,它把文本和模板作为输入,然后输出HTML文件。

Pelican:使用 Markdown 或 ReST 来处理内容, Jinja 2 来制作主题。支持 DVCS, Disqus.。AGPL 许可。

Cactus:为设计师设计的静态站点生成器。

Hyde:基于 Jinja2 的静态站点生成器。

Nikola:一个静态网站和博客生成器。

Tinkerer:Tinkerer 是一个博客引擎/静态站点生成器,由Sphinx驱动。

Lektor:一个简单易用的静态 CMS 和博客引擎。

进程

操作系统进程启动及通信库。

envoy:比 Python subprocess 模块更人性化。

sh:一个完备的 subprocess 替代库。

并发和并行

用以进行并发和并行操作的库。

multiprocessing:(Python 标准库) 基于进程的“线程”接口。

threading:(Python 标准库)更高层的线程接口。

eventlet:支持 WSGI 的异步框架。

Tomorrow:用于产生异步代码的神奇的装饰器语法实现。

uvloop:在libuv之上超快速实现asyncio事件循环。

netius:异步,非常快速。

rocket:多线程。

waitress:多线程, 是它驱动着 Pyramid 框架。

Werkzeug:一个 WSGI 工具库,驱动着 Flask ,而且可以很方便大嵌入到你的项目中去。

RPC 服务器

兼容 RPC 的服务器。

SimpleJSONRPCServer:这个库是 JSON-RPC 规范的一个实现。

SimpleXMLRPCServer:(Python 标准库) 简单的 XML-RPC 服务器实现,单线程。

zeroRPC:zerorpc 是一个灵活的 RPC 实现,基于 ZeroMQ 和 MessagePack。

密码学

cryptography:这个软件包意在提供密码学基本内容和方法提供给 Python 开发者。

hashids:在 Python 中实现 hashids 。

Paramiko:SSHv2 协议的 Python (2.6+, 3.3+) ,提供客户端和服务端的功能。

Passlib:安全密码存储/哈希库,

PyCrypto:Python 密码学工具箱。

PyNacl:网络和密码学(NaCl) 库的 Python 绑定。

图形用户界面

用来创建图形用户界面程序的库。

curses:内建的 ncurses 封装,用来创建终端图形用户界面。

enaml:使用类似 QML 的Declaratic语法来创建美观的用户界面。

kivy:一个用来创建自然用户交互(NUI)应用程序的库,可以运行在 Windows, Linux, Mac OS X, Android 以及 iOS平台上。

pyglet:一个Python 的跨平台窗口及多媒体库。

PyQt:跨平台用户界面框架 Qt 的 Python 绑定 ,支持Qt v4 和 Qt v5。

PySide:P跨平台用户界面框架 Qt 的 Python 绑定 ,支持Qt v4。

Tkinter:Tkinter 是 Python GUI 的一个事实标准库。

Toga:一个 Python 原生的, 操作系统原生的 GUI 工具包。

urwid:一个用来创建终端 GUI 应用的库,支持组件,事件和丰富的色彩等。

wxPython:wxPython 是 wxWidgets C++ 类库和 Python 语言混合的产物。

PyGObject:GLib/GObject/GIO/GTK+ (GTK+3) 的 Python 绑定

Flexx:Flexx 是一个纯 Python 语言编写的用来创建 GUI 程序的工具集,它使用 web 技术进行界面的展示。

游戏开发

超赞的游戏开发库。

Cocos2d:cocos2d 是一个用来开发 2D 游戏, 示例和其他图形/交互应用的框架。基于 pyglet。

Panda3D:由迪士尼开发的 3D 游戏引擎,并由卡内基梅陇娱乐技术中心负责维护。使用C++编写, 针对 Python 进行了完全的封装。

Pygame:Pygame 是一组 Python 模块,用来编写游戏。

PyOgre:Ogre 3D 渲染引擎的 Python 绑定,可以用来开发游戏和仿真程序等任何 3D 应用。

PyOpenGL:OpenGL 的 Python 绑定及其相关 APIs。

PySDL2:SDL2 库的封装,基于 ctypes。

RenPy:一个视觉小说(visual novel)引擎。

日志

用来生成和操作日志的库。

logging:(Python 标准库) 为 Python 提供日志功能。

logbook:Logging 库的替代品。

Eliot:为复杂的和分布式系统创建日志。

Raven:Sentry的 Python 客户端。

Sentry:实时记录和收集日志的服务器。

Testing

进行代码库测试和生成测试数据的库。

测试框架

unittest:(Python 标准库) 单元测试框架。

nose:nose 扩展了 unittest 的功能。

contexts:一个 Python 3.3+ 的 BDD 框架。受到C# – Machine.Specifications的启发。

hypothesis:Hypothesis 是一个基于先进的 Quickcheck 风格特性的测试库。

mamba:Python 的终极测试工具, 拥护BDD。

PyAutoGUI:PyAutoGUI 是一个人性化的跨平台 GUI 自动测试模块。

pyshould:Should 风格的断言,基于 PyHamcrest。

pytest:一个成熟的全功能 Python 测试工具。

green:干净,多彩的测试工具。

Web 测试

Selenium:Selenium WebDriver 的 Python 绑定。

locust:使用 Python 编写的,可扩展的用户加载测试工具。

sixpack:一个和语言无关的 A/B 测试框架。

splinter:开源的 web 应用测试工具。

Mock测试

mock:(Python 标准库) 一个用于伪造测试的库。

doublex:Python 的一个功能强大的 doubles 测试框架。

freezegun:通过伪造日期模块来生成不同的时间。

httmock:针对 Python 2.6+ 和 3.2+ 生成 伪造请求的库。

httpretty:Python 的 HTTP 请求 mock 工具。

responses:伪造 Python 中的 requests 库的一个通用库。

VCR.py:在你的测试中记录和重放 HTTP 交互。

对象工厂

factoryboy:一个 Python 用的测试固件 (test fixtures) 替代库。

mixer:另外一个测试固件 (test fixtures) 替代库,支持 Django, Flask, SQLAlchemy, Peewee 等。

modelmommy:为 Django 测试创建随机固件

代码覆盖率

coverage:代码覆盖率测量。

伪数据

faker:一个 Python 库,用来生成伪数据。

fake2db:伪数据库生成器。

radar:生成随机的日期/时间。

错误处理

FuckIt.py:FuckIt.py 使用最先进的技术来保证你的 Python 代码无论对错都能继续运行。

代码分析和Lint工具

进行代码分析,解析和操作代码库的库和工具。

代码分析

coala:语言独立和易于扩展的代码分析应用程序。

code2flow:把你的 Python 和 JavaScript 代码转换为流程图。

pycallgraph:这个库可以把你的Python 应用的流程(调用图)进行可视化。

pysonar2:Python 类型推断和检索工具。

Lint工具

Flake8:模块化源码检查工具: pep8, pyflakes 以及 co。

Pylint:一个完全可定制的源码分析器。

YAPF: Google的Python代码格式化工具。

pylama:Python 和 JavaScript 的代码审查工具。

代码格式化

autopep8:自动格式化 Python 代码,以使其符合 PEP8 规范。

Debugging Tools

用来进行代码调试的库。

调试器

ipdb:IPython 启用的 pdb。

pudb:全屏,基于控制台的 Python 调试器。

pyringe:可以在 Python 进程中附加和注入代码的调试器。

wdb:一个奇异的 web 调试器,通过 WebSockets 工作。

winpdb:一个具有图形用户界面的 Python 调试器,可以进行远程调试,基于 rpdb2。

django-debug-toolbar:为 Django 显示各种调试信息。

django-devserver:一个 Django 运行服务器的替代品。

flask-debugtoolbar:django-debug-toolbar 的 flask 版。

性能分析器

lineprofiler:逐行性能分析。

Memory Profiler:监控 Python 代码的内存使用。

内存

profiling:一个交互式 Python 性能分析工具。

其他

pyelftools:解析和分析 ELF 文件以及 DWARF 调试信息。

python-statsd:statsd 服务器的 Python 客户端。

Science and Data Analysis

用来进行科学计算和数据分析的库。

astropy:一个天文学 Python 库。

bcbio-nextgen:这个工具箱为全自动高通量测序分析提供符合最佳实践的处理流程。

bccb:生物分析相关代码集合。

Biopython:Biopython 是一组可以免费使用的用来进行生物计算的工具。

blaze:NumPy 和 Pandas 的大数据接口。

cclib:一个用来解析和解释计算化学软件包输出结果的库。

NetworkX:一个为复杂网络设计的高性能软件。

Neupy:执行和测试各种不同的人工神经网络算法。

Numba:Python JIT (just in time) 编译器,针对科学用的 Python ,由Cython 和 NumPy 的开发者开发。

Open Babel:一个化学工具箱,用来描述多种化学数据。

Open Mining:使用 Python 挖掘商业情报 (BI) (Pandas web 接口)。

orange:通过可视化编程或 Python 脚本进行数据挖掘,数据可视化,分析和机器学习。

Pandas:提供高性能,易用的数据结构和数据分析工具。

PyDy:PyDy 是 Python Dynamics 的缩写,用来为动力学运动建模工作流程提供帮助, 基于 NumPy, SciPy, IPython 和 matplotlib。

PyMC:马尔科夫链蒙特卡洛采样工具。

RDKit:化学信息学和机器学习软件。

SciPy:由一些基于 Python ,用于数学,科学和工程的开源软件构成的生态系统。

statsmodels:统计建模和计量经济学。

SymPy:一个用于符号数学的 Python 库。

zipline:一个 Python 算法交易库。

Bayesian-belief-networks:优雅的贝叶斯信念网络框架。

keras: 以tensorflow或者theano为后端的深度学习封装库,快速上手神经网络官网

数据可视化

进行数据可视化的库。 参见: awesome-javascript。

matplotlib:一个 Python 2D 绘图库。

bokeh:用 Python 进行交互式 web 绘图。

ggplot:ggplot2 给 R 提供的 API 的 Python 版本。

plotly:协同 Python 和 matplotlib 工作的 web 绘图库。

pygal:一个 Python SVG 图表创建工具。

pygraphviz:Graphviz 的 Python 接口。

PyQtGraph:交互式实时2D/3D/图像绘制及科学/工程学组件。

SnakeViz:一个基于浏览器的 Python’s cProfile 模块输出结果查看工具。

VisPy:基于 OpenGL 的高性能科学可视化工具。

计算机视觉

计算机视觉库。

OpenCV:开源计算机视觉库。

pyocr:Tesseract和Cuneiform的包装库。

pytesseract:Google Tesseract OCR的另一包装库。

SimpleCV:一个用来创建计算机视觉应用的开源框架。

MapReduce

MapReduce 框架和库。

dpark:Spark 的 Python 克隆版,一个类似 MapReduce 的框架。

dumbo:这个 Python 模块可以让人轻松的编写和运行 Hadoop 程序。

luigi:这个模块帮你构建批处理作业的复杂流水线。

mrjob:在 Hadoop 或 Amazon Web Services 上运行 MapReduce 任务。

PySpark:Spark 的 Python API 。

streamparse:运行针对事实数据流的 Python 代码。集成了Apache Storm。

函数式编程

使用 Python 进行函数式编程。

CyToolz:Toolz 的 Cython 实现 : 高性能函数式工具。

fn.py:在 Python 中进行函数式编程 : 实现了一些享受函数式编程缺失的功能。

funcy:炫酷又实用的函数式工具。

Toolz:一组用于迭代器,函数和字典的函数式编程工具。

第三方 API

用来访问第三方 API的库。 参见: List of Python API Wrappers and Libraries。

apache-libcloud:一个为各种云设计的 Python 库。

boto:Amazon Web Services 的 Python 接口。

django-wordpress:WordPress models and views for Django.

facebook-sdk:Facebook 平台的 Python SDK.

facepy:Facepy 让和 Facebook’s Graph API 的交互变得更容易。

gmail:Gmail 的 Python 接口。

google-api-python-client:Python 用的 Google APIs 客户端库。

gspread:Google 电子表格的 Python API.

twython:Twitter API 的封装。

任务调度

任务调度库。

APScheduler:轻巧但强大的进程内任务调度,使你可以调度函数。

doit:一个任务执行和构建工具。

Plan:如有神助地编写 crontab 文件。

schedule:人性化的 Python 任务调度库。

Spiff:使用纯 Python 实现的强大的工作流引擎。

TaskFlow:一个可以让你方便执行任务的 Python 库,一致并且可靠。

外来函数接口

网络可视化和SDN

用来进行网络可视化和SDN(软件定义网络)的工具和库。

Mininet:一款流行的网络模拟器以及用 Python 编写的 API。

POX:一个针对基于 Python 的软件定义网络应用(例如 OpenFlow SDN 控制器)的开源开发平台。

Pyretic:火热的 SDN 编程语言中的一员,为网络交换机和模拟器提供强大的抽象能力。

SDX Platform:基于 SDN 的 IXP 实现,影响了 Mininet, POX 和 Pyretic。

杂项

不属于上面任何一个类别,但是非常有用的库。

blinker:一个快速的 Python 进程内信号/事件分发系统。

itsdangerous:一系列辅助工具用来将可信的数据传入不可信的环境。

pluginbase:一个简单但是非常灵活的 Python 插件系统。

Pychievements:一个用来创建和追踪成就的 Python 框架。

算法和设计模式

Python 实现的算法和设计模式。

algorithms:一个 Python 算法模块。

python-patterns:Python 设计模式的集合。

sortedcontainers:快速,纯 Python 实现的SortedList,SortedDict 和 SortedSet 类型。

编辑器插件

编辑器和 IDE 的插件

持续集成

参见: awesome-CIandCD.

Travis CI:一个流行的工具,为你的开源和私人项目提供持续集成服务。

Vexor CI:一个为私人 app 提供持续集成的工具,支持按分钟付费。

Wercker:基于 Docker 平台,用来构建和部署微服务。

代码质量

Codacy:自动化代码审查,更加快速的发布高质量代码。对于开源项目是免费的。

QuantifiedCode:一个数据驱动、自动、持续的代码审查工具

发表评论

电子邮件地址不会被公开。 必填项已用*标注