AI

发布于 2020-11-08  267 次阅读


综述

详细内容

3rd

Avatarify 是一款基于 first-order-model 的实时变脸软件,可以在 ZOOM、skype
等视频会议软件中使用,将名人的脸套在自己的脸上。

PaddleOCR 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持
中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

DirectML 是一款开源的,高性能基于 DirectX12 的机器学习库。

TTS - text to sound

X2Paddle

X2Paddle - 百度开发的 用于将其他 深度学习模型转换为 PaddlePaddle 模型的 python 工具。

安装:

// 安装 1
pip install git+https://github.com/PaddlePaddle/X2Paddle.git@develop

// 安装2
pip install x2paddle

// 安装3
git clone https://github.com/PaddlePaddle/X2Paddle.git
cd X2Paddle
git checkout develop
python setup.py install

// 使用方法
x2paddle --framework=tensorflow --model=tf_model.pb --save_dir=pd_model

x2paddle --framework=caffe --prototxt=deploy.proto --weight=deploy.caffemodel --save_dir=pd_model

x2paddle --framework=onnx --model=onnx_model.onnx --save_dir=pd_model

转换后的模型包括 model_with_code 和 inference_model 两个目录

model_with_code - 模型参数,模型代码
inference_model - 序列化的模型结构和参数,可以直接用 paddle 接口进行加载

M2M-100

Facebook 10 月 19 日开源了 M2M-100 模型的源代码,并称该算法是第一个能够在不依赖英语数据的情况下,在 100 种语言之间进行翻译的算法。也就是这说,无需通过英文做中介,该模型就可对这 100 种语言直接互译。

M2M-100 基于 Facebook 的多语言模型 XLM-R,使用 ccAligned,ccMatrix 和 LASER 等开源数据挖掘工具收集了包含 100 多种语言的超过 75 亿个句子,根据语言分类、地理和文化相似性等参数分为 14 种不同的语言组。在 14 个语言组中,每个语言会被标识一到三种“过渡语言”,然后将其作为翻译成不同语言组的基础。


朝闻道,夕死可矣