最近谷歌的Notebooklm热火朝天, 其实刚出来的时候我就跟球友说了,但是我觉得英文对于我们来说不太友好,所以也没写,然而昨天一个大佬直接做了一个开源版本。 现在我们可以上传自己想要的材料,然后就能听中文播客了! 对于没了解NBLM的人,我先说说它是什么呢? NotebookLM可以帮助用户通过上传文档,快速理解复杂的内容,不仅能自动生成文本总结,还能把内容转换为音频,非常适合重度的播客爱好者。 Notebooklm+heygen 比如我上传一本比较难啃的书(麦肯锡方法): Notebooklm马上就能拆解这本书: 1- 给出整套书的学习指南 2- 给出书本的总结概览 3- 播客对谈,以播客形式深入浅出地让我们能容易学进去 4- 提问任何不懂的问题 ,当它回答你的问题时,会自动提供相关的原文引用 其中第三点是Notebooklm爆火的重点,但因为生成的播客是英文,所以不太实用。 然而开源社区总是那么的伟大, 我来带大家走一下怎么上传资料形成中文播客对谈。 在线即可使用,准备工具: - 科学 - OpenAIkey 第一步: https://huggingface.co/spaces/lamm-mit/PDF2Audio 第二步: 上传文档 我这里还是上传刚刚的麦肯锡方法,填入OpenAI Key,选用模型,这里我试了一下4omini的效果已经足够了。 这里有若干种形式可以选择,我们不用变,选择podcast播客。 右边的提示词我们全部加上##中文输出; 然后输出的字数看个人限制,如果没有速率限制的话就不用改,我这里改为了5000字。 然后点击上方的Generate,生成音频和转录的文字。 当然目前支持的人声比较少,而且openai的中文比较难听。 但成本非常低,一本麦肯锡书才用了0.08美刀。 我看了一下,代码就几百行,感觉连上我们的chattts不是问题, 加上剪映的自动素材功能,未来未必不是一条变形的好路子。