录音一秒生成文字 Gemini App解锁新功能

自由3C科技 2025-09-09 15:38+-

  Google 稍早再度替 Gemini App 进行升级!正式开放上传音讯档案,可以让 AI 协助处理会议、课堂的录音逐字稿。

  无论是在手机、网页版本,现在点击 Gemini 对话框里的“+”图示,可以点选“档案上传”,并且支援 MP3、M4A、WAV 等不同格式的音讯档。

       根据记者实测,可以请 AI 生成逐字稿,让你的会议记录或是课堂录音不用重听,一秒即能直接获得完整内容,甚至可以要求加上时间轴、辨识不同的发言者。

  Google Labs 和 Gemini 副总裁 Josh Woodward 也在 X 的发文上透露,“支援音讯档”可以说是 Gemini App 最热门的要求,如今 Gemini 已经可以支援各种档案的上传。不过根据 Google 的使用限制,每次指令最多只能容纳 10 个档案。

录音一秒生成文字  Gemini App解锁新功能

(图/黄肇祥摄)