百度AI最新产品SwiftScribe是一款功能强大且免费的音频转录文字软件,它采用的是最新先时的语音识别技术,可以将音频快速转换成文字,并支持一键下载,可以完胜速记赤豆,比快的速度要快1.67倍!
使用方法
用户打开软件,选取wav和mp3格式的文件上传,系统就能马上进行处理,时长1分钟的音频文件可以在30秒内转换完成。用户可使用键盘快捷键就能进行加快播放、后退和添加换行符等操作,处理完成后,只需人工调整大小写、标点及部分拼写细节即可快捷、准确的完成音频转换。
从使用效果看,SwiftScribe可为速记员带来1.67倍的效率提升,缩短40%的工作时间。目前该系统可处理1小时内的音频文件,而这一时长正在开发团队的努力下逐步延展,未来会增加视频文件的语音识别及自动添加标点符号等功能,并支持更多文件格式,降低用户使用门槛。
此次推出的SwiftScribe网页应用,依托于百度新一代深度语音识别系统Deep Speech 2——曾被《麻省理工科技评论》评为“2016年十大突破技术”之一。通过利用长达数千小时的语音数据训练,Deep Speech 2可以不断“学习”从语音中识别特定的字或词。MIT评论其:在识别汉语语音片段方面,要比人为识别更加准确。目前,百度语音识别准确率已达到97%,成为行业领先者。
作为非英语母语者,百度SwiftScribe项目经理吴田也曾深受长语音记录的困扰“要整理一段1小时录音对我来说要花上10个小时,” 而这也是这一应用的灵感来源。百度在去年也推出了应用DeepSpeech2的安卓输入法TalkType,让用户能够用语音快速输入文字。百度硅谷人工智能实验室项目领导人Bijit Halder在公告中称:“TalkType是首款智能语音优先输入法。”
对话机器将成为2017人工智能的发展风口,百度吴恩达曾在《华尔街日报》的采访中表示,随着准确率的提高和用户体验的提升,百度的语音产品已度过用户心目中的“试用期”。在语音产品迅猛发展的大环境下,亚马逊、苹果、谷歌和微软等科技巨头都在加紧研发各自的语音识别技术,然而在长文本音频转化技术上,百度仍然是行业最高水平的标杆。该应用非常适合将长语音转换为文本的人士,人工智能将实现1+1大于二的效果。
百度在国内虽然声名狼藉,但它在海外开设的实验机构还是在干实事的。今天百度公布了一款借助DeepSpeech语音识别核心的网页式语音转录应用SwiftScribe,尽管还处在测试的初级阶段,不过据说至少效率相当不错。
SwiftScribe的使用方法和我们今天在多数网页应用里的操作大体一致,用户在一个简单的网页里上传.wav或.mp3音频文件——在SwiftScribe的情境下通常是记录人物讲话的录音,上传完成后,语音识别AI就会即刻开始听写用户刚刚上传的材料。它的动作很快,通常只需要话音频全长的三分之一时间便可完成听写。SwiftScribe单次能接受的最长语音材料为一小时,算下来处理时间需要20分钟。
因为技术尚未完善,SwiftScribe现阶段并不能做到听写100%准确,某些特定的单词它会写错,标点也不是很会打,这种时候仍需要用户做一遍检查,手工把它输出错误的文字给修改过来。SwiftScribe内置变速阅读工具,在人工复查时可以调慢音频的播放速度进行校对。
百度SwiftScribe的团队领导人表示该工具将能帮助转录人员提升三分之二的工作效率,不过目前来说它还需要花至少好几个月进行打磨,他们也计划邀请数十名专职做转录的行业人士参与公开测试,协助改进SwiftScribe。接下来这个转录AI还要面对视频转录和添加字母、适配更多文件格式,以及自动标点等挑战。百度打算在SwiftScribe成熟之后在其上开发收费点,目前来说SwiftScribe还是免费的。不过按照百度的习性和天下没有免费午餐的定律,并不推荐使用它转录一些非常关键或敏感的信息
小编简评:右键点击“
下载 SwiftScribe(AI音频转录工具) 25M /小编简评:SwiftScrib
下载 Windows优化大师(wopti)绿色版 6.5M /小编简评:文件下载后
下载 绿色关机软件(Switch Off) 393KB /小编简评:Switch Off
下载 百度贴吧顶贴机 2.4 免费版 1.5M /小编简评:百度贴吧顶
下载 多国时钟升级软件(Microsoft Chinese Date & Time ) 55KB /小编简评:Microsoft
下载 Windows优化大师 7.3M /小编简评:从系统信息
下载 时可通(windows时钟升级) 479KB /小编简评:windows时钟
下载 Wireshark(抓包工具) 22.5M /小编简评:Wireshark2
网友评论