Theme NexT works best with JavaScript enabled
0%

PaddleHub

Look Look 开源项目 PaddleHub ^ _ ^

PaddleHub简介

PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型。其中涵盖CV、NLP、Audio、Video、工业应用主流五大品类的 300+ 预训练模型,全部开源下载,离线可运行。

项目地址:https://github.com/PaddlePaddle/PaddleHub

安装

环境依赖

1
2
3
4
5
# 安装gpu版本的PaddlePaddle
pip install paddlepaddle-gpu -U

# 或者安装cpu版本的paddlepaddle
# pip install paddlepaddle -U

安装命令

1
pip install paddlehub==2.1.0

除上述依赖外,PaddleHub的预训练模型和预置数据集需要连接服务端进行下载,请确保机器可以正常访问网络。若本地已存在相关的数据集和预训练模型,则可以离线运行PaddleHub。

使用PaddleHub下载数据集、预训练模型等,要求机器可以访问外网。可以使用server_check()可以检查本地与远端PaddleHub-Server的连接状态,使用方法如下:

1
2
3
4
import paddlehub
paddlehub.server_check()
# 如果可以连接远端PaddleHub-Server,则显示Request Hub-Server successfully。
# 如果无法连接远端PaddleHub-Server,则显示Request Hub-Server unsuccessfully。

快速体验

在PaddleHub中,Module代表一个可执行模块,一般来讲就是一个可以端到端预测的预训练模型(例如目标检测模型、中文词法分析模型),又或者是一个需要根据下游任务进一步微调(迁移学习)的模型,例如BERT/ERNIE。

PaddleHub采用模型即软件的设计理念,所有的预训练模型与Python软件包类似,具备版本的概念。

人像分割

1
2
3
4
5
6
7
8
import paddlehub as hub
# module = hub.Module(name="humanseg_lite", version="1.1.1")
module = hub.Module(name="humanseg_lite")

res = module.segmentation(
paths = ["./test_image.jpg"],
visualization=True,
output_dir='humanseg_output')