最近Google发布文章宣布,其旗下的Gemini AI将支援更多类型的文件,并透过分析、摘录、洞察文档内容,以为用户提供更优质的AI服务。

对此,Google指出,目前订阅Gemini Business、Enterprise、Education或Education Premium许可证的Google Workspace用户,现在可以从Google Drive或本地设备上上传各种文件到Gemini。
各种文件支援类型如下:
- 电子表格:Gemini AI现在可以处理CSV、XLSX和ODS等格式的电子表格,以便用户能够分析数字数据、跟踪趋势,并从财务模型、销售报告等生成洞察力报告。
- 演示文稿:用户可以上传PPTX、PDF和KEY等格式的演示文稿,并让Gemini AI可以提取要点、总结内容并识别图标和图像等视觉元素。
- 图像:Gemini AI现在还可以分析JPEG、PNG和GIF等格式的图像,提取文本、识别对象并为图像内容提供上下文。
- 音频:用户现在可以上传MP3、WAV和FLAC等格式的音频文件,让Gemini AI能够转录语音、识别发言人,并总结访谈、播客和讲座中的要点。
- 视频:Gemini AI现在能处理MP4、MOV和AVI等格式的视频文件,从演示文稿、纪录片和培训视频中提取脚本、识别场景并总结关键事件。

对此,官方指出,这项措施将从2024年8月27日起全面推出,并适用于Gemini Business、Enterprise、Education或Education Premium许可证的Google Workspace用户。