一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

文章目录

    国内有很多知名的文本转语音API平台,比如:百度文字转语音-AI智能识别技术、讯飞文字转语音等 功能类似,基本都是在线可以转换,效果接近真人发音,一键导出MP3&#
    低风险

    国内有很多知名的文本转语音API平台,比如:百度文字转语音-AI智能识别技术、讯飞文字转语音等

    功能类似,基本都是在线可以转换,效果接近真人发音,一键导出MP3…

    最近一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS 开源了~

    Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。

    Parler TTS 特色说明:

    • 数据集:
      • 使用更多数据进行训练
      • 添加更多功能,例如重音
    • 训练:
      • 添加 PEFT 兼容性以进行 Lora 微调。
      • 添加在没有描述列的情况下进行训练的可能性。
      • 添加笔记本培训。
      • 探索多语言培训。
      • 探索单扬声器微调。
      • 探索更多架构。
    • 优化:
      • 编译和静态缓存
      • 支持 FA2 和 SDPA
    • 评估:
      • 添加更多评估指标

    文本转语音 (TTS) 模型演示地址:

    https://huggingface.co/spaces/parler-tts/parler_tts_mini

    (可能需要翻墙访问~)

    Parler TTS安装用法:

    TTS 具有轻量级依赖关系,可以一键快速安装:

    pip install git+https://github.com/huggingface/parler-tts.git

    使用 Parler-TTS 就像“bonjour”一样简单。只需使用推理片段即可….

    Parler-TTS是一个完全开源的发布版本,所有的数据集、预处理、训练代码和权重都以宽松的许可证公开发布,感兴趣的小伙伴们可以在线体验和研究….






    文件名称:一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

    更新日期:2024-4-14

    文件大小:73K

    广

    点击下载

    本站采用署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)许可协议授权。
    本站坚持“不能用的源码发出去都是浪费大家时间“,付费源码都是亲测的
    源码已测试,但不保证完美无bug!站长是一位10年老技术,所有会员都可以免费咨询,在线指导提供运营建议!交个朋友~
    全球主机测评网仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请提供相应的资质证明,请联系客服予以删除。

    全球主机测评网 » 一款高质量/轻量级AI-TTS模型的推理和训练库-Parler TTS

    常见问题FAQ

    全球服务器都是质量可靠的吗?
    国内外服务器商非常多,因市场环境因素,不少主机商有跑路风险,建议选择稳定性实力雄厚的主机商,如果只是短期测试项目可以选择性价比云服务器,本站所有服务器不保证质量,仅做参考!
    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    全球主机测评网
    专注于国内外云服务器、VPS、虚拟主机的评测平台