一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

国内有很多知名的文本转语音API平台,比如:百度文字转语音-AI智能识别技术、讯飞文字转语音等

功能类似,基本都是在线可以转换,效果接近真人发音,一键导出MP3…

最近一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS 开源了~

Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。

Parler TTS 特色说明:

  • 数据集:
    • 使用更多数据进行训练
    • 添加更多功能,例如重音
  • 训练:
    • 添加 PEFT 兼容性以进行 Lora 微调。
    • 添加在没有描述列的情况下进行训练的可能性。
    • 添加笔记本培训。
    • 探索多语言培训。
    • 探索单扬声器微调。
    • 探索更多架构。
  • 优化:
    • 编译和静态缓存
    • 支持 FA2 和 SDPA
  • 评估:
    • 添加更多评估指标

文本转语音 (TTS) 模型演示地址:

https://huggingface.co/spaces/parler-tts/parler_tts_mini

(可能需要翻墙访问~)

Parler TTS安装用法:

TTS 具有轻量级依赖关系,可以一键快速安装:

pip install git+https://github.com/huggingface/parler-tts.git

使用 Parler-TTS 就像“bonjour”一样简单。只需使用推理片段即可….

Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的小伙伴们可以在线体验和研究….






文件名称:一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

更新日期:2024-4-14

文件大小:73K

广

点击下载

本站采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)许可协议授权。
本站坚持“不能用的源码发出去都是浪费大家时间“,付费源码都是亲测的
源码已测试,但不保证完美无bug!站长是一位10年老技术,所有会员都可以免费咨询,在线指导提供运营建议!交个朋友~
全球主机测评网仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请提供相应的资质证明,请联系客服予以删除。

全球主机测评网 » 一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

常见问题FAQ

全球服务器都是质量可靠的吗?
国内外服务器商非常多,因市场环境因素,不少主机商有跑路风险,建议选择稳定性实力雄厚的主机商,如果只是短期测试项目可以选择性价比云服务器,本站所有服务器不保证质量,仅做参考!
免费下载或者VIP会员专享资源能否直接商用?
本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
全球主机测评网
专注于国内外云服务器、VPS、虚拟主机的评测平台