AI 工具推荐:用 Modal Podcast Transcriber +Glarity, 一键生成播客/Podcast摘要

通过 Modal Podcast Transcriber 用 OpenAI Whisper 提取 (Spotify) Podcast 的字幕,然后配合 Glarity 插件,一键生成摘要,1 分钟了解全貌,效率 x100

加入 1,600+ 订阅者,获得关于Web3和AI如何赋能个人品牌和企业的最新案例和思考

目前生成Youtube摘要的工具,都是基于字幕。经常有读者留言,没有字幕的Podcast怎么办?

办法来了↓

先用Modal Podcast Transcriber提取 (Spotify) Podcast 的字幕,然后用 Glarity一键生成摘要,1 分钟了解全貌,效率 x100!

下面是详细用法和 2 个彩蛋👇

1️⃣ 用Modal Podcast Transcriber ,将Podcast用Whisper生成字幕

OpenAI于2022年9月底发布的Whisper语音识别模型是深度学习领域的又一里程碑,Modal Labs将其封装成了一个字幕转换器,直接搜索播客的名字或者主题,就可以找到对应的播客(我找到了Creative Control

使用链接: https://modal-labs--whisper-pod-transcriber-fastapi-app.modal.run/

在播客里找到对应的节目后,点击「Transcriber Now」,1 小时的节目,大概 1 分钟左右,就能生成全部字幕

Modal Labs 在这里做了并行优化,可以点击这里了解更多,包括 GitHub 源代码

2️⃣ 用 Glarity 插件,将字幕变成摘要

有了字幕之后,就有很多方法来生成摘要了,最简单的是用我之前推荐过的浏览器插件Glarity

因为Podcast内容比较长,我将Glarity的Propmt修改为:Read the whole content on the webpage, then summarize them in 10 bullet points

Glarity安装地址及使用技巧

这一步也可以换成自己熟悉的方法,比如我用了GPT4 + WebPilot 插件,可以更个性化的修改 Prompt. 我指定了主题,让内容更聚焦

看起来GPT4的「总结」能力更强,Google Bard 的结果也不错

说实话 WebPilot 是 GPT4 我用到现在最满意的功能,每个月 $20 比实习生便宜太多了, Onekey 现在可以直接支付

3️⃣ 彩蛋 1,配合【沉浸式浏览】,可以双语浏览整个播客

希望更详细了解播客内容?没问题,【沉浸式浏览】插件帮助你双语快速浏览

4️⃣ 彩蛋 2,每条字幕都有对应的原始音频

如果你阅读字幕的时候想知道,他们真的这样说吗,用什么样的口气呢?点击右侧的时间戳,马上找到答案!

竞争带来创新

之前我听播客用的最多的是 Snipd, 也推荐给了不少朋友。优点是自动生成大纲和总结,但缺点也很明显,「总结」太简单基本上没有可参考性,也不能自定义 Prompt 和提取完整字幕

Whisper + GPT 打开了音频的无限可能性,比如 Naval 投资的 Airchat, 也希望 Snipd 可以有更多创新

生成Podcast摘要总结

1️⃣ 用Modal Podcast Transcriber ,将Podcast用Whisper生成字幕

2️⃣ 用Glarity插件,将字幕变成摘要。这一步也可以换成自己熟悉的方法,我用了GPT4 + WebPilot, Google Bard也不错

3️⃣ 配合【沉浸式浏览】,可以双语浏览整个播客

4️⃣ 可以查看每条字幕对应的原始音频

最后会有朋友问,那如果是Modal Labs没有收录到的 Podcast, 或者是本地音频怎么做摘要?莫急,相应的方法我也研究出来了,敬请期待

欢迎查看更多 AI 工具 & Mindset 分享

恭喜你阅读到最后!欢迎分享这封 Web3Brand Newsletter 给你的朋友或者到社交网络,让更多的人可以看到我们, thx!

Share

Loading...
highlight
Collect this post to permanently own it.
Web3Brand | Empower Global Individuals logo
Subscribe to Web3Brand | Empower Global Individuals and never miss a post.