NotebookLM基本上可視為以Gemini為基礎的生成式AI Agent,最初在2023年公開時,以Gemini 1.0為模型,用所謂的RAG(檢索增強生成)的方式,也就是匯入文件來強化AI本身對於文本的精準度,接著用其代理人的功能來做「心智圖」、「內容摘要」、「記憶卡片」(學習卡)等,可見NotebookLM最初的用意是從使用者的記事本中,彙整使用者的筆記來做考試或是片段記憶的彙整工具。

但NotebookLM到後來變得更強了,2024年中增加了「多模態」的匯出,例如最出名的是生成文件的Podcast錄音,宛如廣播節目的形式,一開始先從英文版發起,後來中文版導入,成為很多AI Youtuber介紹文件的解決方案,網路上逐漸充斥。(也產生很多類似詐騙的手法,這邊先不論)

2025年後,NotebookLM從Podcast再往「懶人包」、「簡報」與「簡報影片」邁進,以Google的Nano Banana Pro為基礎來製作,並且其模型已採用Gemini 3,自此,NotebookLM已可輸出包含文字、圖表、語音、簡報、影片等多媒體,成為極為強大的工具!

我自2023年初次使用NotebookLM,對於其能將自己的文件整理概要,甚是驚艷。到2024年中後,Podcast功能出現時,一開始雖只能用英語版的,但其語音的流暢,已不是驚豔可以形容,至2025年初中文版出現時,我將自己許多撰寫的內容重新用Podcast功能輸出,已成功讓人進入圖靈時刻,真假莫辨。之後,因為父親的作品《野鶴隨筆》付梓,用此功能體驗/測試AI的強大,也讓父親初步知道這些工具的厲害。

至最近,由於Nano Banana Pro已穩定,並且聽聞NotebookLM與之結合的盛名,因此再次用父親的作品測試,將之變成「懶人包」的圖像輸出,這次更讓父親覺得有趣,新奇,在還沒告訴他是AI生成時,他還以為這是哪個高人做的,只是「字」有不少錯誤。後來告訴他說這是AI做的,就令他想要知道是怎麼生成的,因而有了這篇的文章出來。


首先我們進入NotebookLM的介面中,點選新增來源⓵,選取我父親之前的著作(四本),接著會在左下角「選取所有來源」的地方出現檔案名稱⓶,以及在介面中間的地方出現選取檔案的「摘要」⓷,並且可在這個介面輸入提示詞(Prompt)進一步讓AI萃取使用者想要的資料。

圖1 NotebookLM的主畫面

在介面的右側有很多的功能,我這裡主要要使用的是⓸資訊圖表,也就是輸出會產生懶人包,最後會在右下角出現輸出的⓹懶人包檔案。

接著我們來細部說明資訊圖表的操作。點選上述⓸資訊圖表,會出現如下畫面。

圖2 自訂資訊圖表設定(選擇語言為中文,其他皆為預設值)

若按照初始值,並調整「選擇語言」為中文(繁體),則會出現以下懶人包圖片。

圖3 預設值輸出懶人包(僅調整語系為繁體中文)

看似圖片精彩,但細部看會發現有待加強,主要是目前的Nano Banana對於繁體中文的支援在字體較大的字比較沒問題,但輸出為小字時,就會出現大家都無法認得的字,只能意會,因為GenAI的輸出通常是向量轉點陣圖,但轉點陣後其實解析度變得很差,加上GenAI本來就不認得字,他輸出就是圖的概念。

目前雖然有許多AI的網站都在解決這個圖形OCR的辨認問題,並且還有免費的限制,但很快的,NotebookLM已逐步認知這個問題,未來應該在介面上就能做更改(如電腦王阿達的網站有介紹)。但是在這個更改還很痛苦的情況下,自己PS修改檔案對我而言還是比較輕鬆的,修改後如下,大家可以發現稍微黑體的就是我修改的字,有些甚至是全部都改過(遠看沒發現,近看都是錯字)。

圖4 修正後的預設懶人包圖片

接著我們來試用「詳細」的功能,並加上簡單的提示詞(比較四份文件的差異),然而這次我忘記調整語系,以預設的English來做輸出。

圖5 自訂資訊圖表設定(預設語言為英文,其他均有設定)

結果,就產生了如下的懶人包,這次是以四象限的方式來說明四本書,非常地完整,只是第二本書AI認為是時序上的第三本書,這應該是需要做提示詞的調整。

圖6 輸出懶人包(預設語言為英文,詳細內容)

後來,我再將語系改為中文(繁體)後,其他均與前述一致。

圖7 自訂資訊圖表設定(語系調整為中文,其他均有設定)

最後產出如下的懶人包圖片。細看後期時會發現很多文字上的問題,因此我們仍然用PS大法來處理。

圖8 輸出懶人包(調整語系為繁體中文、詳細內容)

調整後如下,黑色字均為調整之內容,細部字均需要調整,可見內容愈詳細,字形錯誤很多。

圖9 修正後的輸出懶人包圖片


總結:

NotebookLM的功能已令大家覺得相當實用,主要是在於後來加入Podcast功能以及Nano Banana Pro,使得語音、圖像的功能變得更強。我們這些長期在智庫的人其實會很期待這些功能的誕生,快速產生好圖、或是藉由這些圖片的概念衍生做出自己需要的架構,抑或是可以產出過往需要很多預算才會有的概念影片。

我目前認為這些圖像化GenAI,有時並不是讓研究人員減少事做,而是大家都要有一致的能力可以弄出好圖片、賞心悅目。過往演講高手可能不擅長製圖,經常透過字牆來表達,如今需要做到的是用等同的時間去做出AI圖片,但卻會有更好的觀感,何樂不為。

只是這或許對於平面設計、版面設計、美術美工會有很大的影響,甚至這些人要有更多的斜槓來去因應這些便利工具變成一般使用者的常態。

就如本示範案例一樣,我父親對於這些圖片文案的興奮,其實這在不久的將來或是現在就成為一般人的日常,技術轉瞬太快。我近來就在想,我的神師吳新豪神父對於資訊工具的熱愛,若沒在COVID-19時過世,他看到現在的GenAI的進步,一定能讓他對於福音用更有效率的方式傳播出去,現在只能成為追憶了。

創作者介紹

小魚Roger 發表在 痞客邦 留言(0) 人氣(28)