PD虚拟机     VPS     Win11     微软     苹果     SetApp     Office     精选

媲美真人配音!微软语音合成助手 - 免费文字转换音频的 TTS 工具 (发音更有感情)

惊艳的配音神器  多媒体类, 视频音乐    , ,    2022-07-22
媲美真人配音!微软语音合成助手 - 免费文字转换音频的 TTS 工具 (发音更有感情)
17 下载

AI 技术在飞速发展,比如美颜换脸、文字识别语音识别移除图片背景、自动驾驶等等都在生活的各个方面起到了应用。而「语音合成 TTS」方面,如今实用性也已非常惊人了。

腾讯云阿里云、百度云等都推出文字转语音在线服务 API,但合成的人声大多时候都很容易听出“机器人味”。而微软Azure TTS 文本转语音服务效果就比较让人惊叹了!它拥有多种声音和情感风格,能像真人一样朗读出抑扬顿挫,使得合成的人声非常逼真自然,不妨来看看……

微软自然语音转换 - 像真人般将文本朗读出来并保存成音频

微软文本转语音Azure Text to Speech 是一个能将文字转换成真人般自然朗读的云服务,相比同类 TTS 强大之处在于,它借助 AI 神经网络技术,让合成的语音拥有媲美真人的表现力,实现人声语调与情感匹配,朗读时能表现出高兴、悲伤、新闻广播、客服、恐惧、耳语等情感。

微软语音合成助手 Azure TTS

加上语速、语调、发音、停顿都可以由用户调节,实际生成的语音非常自然逼真!完全不再像机器人了!因此微软文本转语音技术几乎能应用在任何场景。新版的 Edge 浏览器的朗读功能就是基于此技术而来。可惜此服务是付费的,你还懂编程才能用上它,这似乎离普通用户很远?

别急!其实,微软提供了一个免费的在线 DEMO 演示,可以让用户随便输入文字实现在线试听 (但字数有限制,且试听无法保存)。于是,高手们纷纷各显神通,给我们带来了几款如微软语音合成助手Edge-TTS-record微软 TTS 下载按钮脚本插件等免费工具,可以帮助你将一大段文字转换成音频导出 mp3 或录制成 wav 保存下来,用于其他地方。

微软 TTS 朗读效果预览:

我们先来听几段微软文本转语音的效果吧,相信你一定能听出来,它真的比目前大多数 TTS 同行要优秀很多,情感表现力简直满分!开心、严肃不同场景可以用不同的调调,就连讲个鬼故事也都能讲出害怕的感觉。

其实如今在哔哩哔哩、抖音、快手里好多视频的配音,都有使用了这个微软语音库来生成,人的声音听起来很自然,不特意地去留意,基本都分辨不出来是用机器合成的。

微软语音合成助手免费版 (Windows)

微软语音合成助手」是一款完全免费的文字转语音的 Windows 电脑版软件,它绿色免安装,而且体积小巧,打开就能使用 (需联网),软件界面非常简洁,上手即会使用。

微软语音合成助手 Azure TTS

它完全借助了微软的 Azure TTS 服务来将文字合成并生成语音,支持在线试听,也可以保存成 mp3 音频文件,效果非常接近真人朗读!不仅真实自然,而且也能设置它的情感风格、语速、停顿、音量等等。

微软语音合成助手可以支持导入 TXT、SRT 字幕、PDF 多种格式的文档文件,甚至还能支持 JPG、PNG 截图里的文字识别并导入成文本内容。并且重点是,此软件使用了分段下载合并的方式解决了一次只能转换 2500 个字数限制的问题。

软件支持保存导出编辑内容,支持翻译,自动排版,自动标点,文本替换,敏感词提醒,敏感词替换,SSML 多人语音混编等多种功能,还可以实现批量转换。

浏览器插件:微软 TTS 下载音频按钮(油猴脚本)

前面说到,微软 TTS 本身提供了文字转语音的在线演示的网页版,可以让用户在浏览器上输入或粘贴文本,转换成语音进行试听,但官网上并不提供下载功能。因此,有开发者制作了这么一个「微软 TTS 下载音频按钮」插件,可以让你将试听的语音下载保存成 MP3 音频。

微软 TTS 语音下载按钮插件

这款浏览器插件是完全免费的,它是以 UserScript (油猴脚本) 的形式提供的,比如 ChromeEdge 等浏览器安装了 Tempermonkey 插件后就能安装此类脚本。安装成功并启用的话,微软 TTS 的网页上除了试听按钮以外,还会如上图一样,增加一个「下载音频」的按钮。

所以,如果你使用 MacLinux 或者不希望下载第三方软件,那么使用此脚本也可以在浏览器里搞定文本转音频。

Edge-TTS-record 开源录制工具

这款开源免费的「edge-TTS-record」工具,是一款可以录制 Microsoft Edge 浏览器的语音合成(TTS)语音并输出为 .wav 音频的 Windows 版工具。另外,网上也有一款名为「Read Aloud by asup」的工具与此程序几乎一样,暂不知道是否同一作者。

Edge TTS record 微软语音录制工具

由于 Edge 浏览器也是使用了微软 Azure TTS 的技术,因此它拥有了同样的逼真自然的声音引擎,包括了晓晓、云杨等人物声音。不过相比前两者,此工具的实现方法是需要将试听的声音进行“录音”而来的,因此录制时间较长,同时过程中也可能受到系统其他软件声音的影响。

aspeak - 命令行文字转语音工具:

对于有特殊需求的朋友,还有一款命令行版的微软 TTS 语音合成工具 aspeak,这是用 Python 编写的基于 Azure 语音合成的命令行程序,安装简单,还可以跨平台使用。

#安装 aspeak
pip install --upgrade aspeak

# 最简单的例子:
aspeak -t "异次元软件世界,你好呀!" -l zh-CN

#导入 .txt 文件,并转换成 .wav 音频保存
aspeak -f input.txt -l zh-CN -o ouput.wav

更多具体的参数,比如怎样指定语音,大家可以看 aspeak 的官方文档。至于此工具的的实际应用例子嘛,就得看大家发挥想象力和二次开发的能力了。

总结:

不管你是视频 UP 主、自媒体还是办公人士,借助微软 Azure TTS 的语音合成引擎来不仅能录制一些旁白、朗读稿子电子书、给视频配音等,也能自娱自乐,给生活和工作都带来方便与乐趣。

上面的几款工具都是免费的,感兴趣和有需要的朋友都可以下载使用。当然了,微软这个 TTS 云服务接口本来是需要付费的,而这些免费工具都是基于微软的免费 Demo 演示开发而来,哪一天要是被关掉了,可能就无法使用了。所以,免费有限,大家且用且珍惜吧……

相关文件下载地址

官方网站:访问
软件性质:免费/开源
相关链接:人工智能相关  |  微软相关  |  视频相关  |  素材相关  |  语音相关
解压密码:www.iplaysoft.com

下载微软语音合成助手 (Win)  |  Edge-TTS-record (Win)  |  微软 TTS 下载按钮 (浏览器脚本)

/ 关注 “异次元软件世界” 微信公众号,获取最新软件推送 /

  • andyjiang

    最近做视频,配音一直在用这个,之前从抖音上看到的

    2022-07-22 08:50:59
  • peach5460

    这种免费工具,不是很敢用啊
    万一哪天就失效了,挺麻烦的

    2022-07-22 09:06:21
  • CCCCCCC

    Wacatac.B!ml 报毒呃 用起来没事吧

    2022-07-22 09:07:01
  • 鹏爷

    感谢分享,上次做ppt就是用的油猴脚本生成的语音,调整了下字幕,就是个超豪华ppt,ppt做了3天,生成视频1小时,真的好使,我是回来好评的。

    2022-07-22 10:49:29
  • meavel

    嘿嘿嘿、省了我的口水

    2022-07-22 11:06:05
  • Kin

    看起来不错!
    只支持中英文吗?

    2022-07-22 12:13:24
  • 来学知识

    讲真,声音真的好听…….拿来自己听书,或者解闷都是极好的….

    2022-07-22 17:02:09
  • Coolkk

    请问有没有让 Chrome 阅读网页的插件/脚本呢?现在想审核一下自己的文案,都放在 word 里面用大声朗读功能,如果有插件就好了~

    2022-07-22 17:18:57
    • Coolkk

      找到了:https://greasyfork.org/zh-CN/scripts/429810-%E5%A4%A7%E5%A3%B0%E6%9C%97%E8%AF%BB-tts%E8%BE%85%E5%8A%A9%E9%98%85%E8%AF%BB

      2022-07-25 14:31:46
  • lonznt

    不如智影里的丰富呀

    2022-07-25 01:18:17
  • QQ

    https://github.com/ag2s20150909/TTS/releases
    试试

    2022-07-25 16:31:42
  • xiaoT

    合成失败,如何解决啊?

    2022-07-27 14:22:38
  • 一千个太阳

    太强大了,抖音和小红书上都是莫的感情的机器人

    2022-07-29 12:42:31
  • Robin

    不知道为啥,使用“微软语音合成助手免费版”,合成失败。

    2022-07-29 16:12:26
    • 波比

      估计打不开了

      2022-07-30 23:57:19
  • 天羽屠龙舞

    很不错,发音比讯飞有声,更有感情了!

    但是,我发现明明很简单的字,怎么会读错!

    比如:乘,就读成“剩”

    2022-07-31 16:59:38
  • 栗子烧鹅

    微软的页面上没有说明,这种合成的会有版权问题吗?扒下来虽然是免费的,但是可不可以商用呢

    2022-08-10 16:13:28





评论内容 (*必填):
Ctrl + Enter 快速提交   

赞赏异次元


请通过支付宝、微信 APP 扫一扫,海外读者可「使用 PayPal 赞赏

“ 感谢您对异次元网站的支持! ”