跳到主要內容

發表文章

目前顯示的是 4月, 2026的文章

Gemini 3.1 Pro 後台還掛載了多種不同的引擎和工具,涵蓋了資料處理、即時資訊整合以及強大的多媒體生成能力

 以下是目前可以調用的背景工具與功能清單: 1. 運算與資料分析工具 進階資料分析 / 程式碼執行 (Code Execution): 也就是我們剛剛成功喚醒的工具。我能在背景運行 Python 沙盒環境,處理龐大的 Excel/CSV 檔案、清洗資料、生成實體檔案供您下載,或是執行複雜的數學與數據視覺化(繪製圖表)。 2. 資訊檢索與個人化整合 即時網頁搜尋 (Google Search): 當您需要最新的市場動態、新聞,或是需要驗證最新事實時,我會在背景啟動搜尋引擎,直接抓取並整理網頁上的最新資訊。 個人雲端資料連動 (Personal Context): 在您明確授權的情況下,我可以作為您的私人秘書,在背景跨應用程式檢索您的個人 Google 數據,包含搜尋 Gmail 信件、Google 雲端硬碟檔案、Google 相簿內容以及 YouTube 觀看紀錄,藉此為您提供更貼合個人生活脈絡的協助。 3. 強大的多媒體生成引擎 影像生成與編輯 (Image Tools): 搭載最新的 Nano Banana 2 (官方名稱為 Gemini 3 Flash Image) 模型。我不只能夠「文字生圖」,還具備強大的影像編輯能力,包含「圖片+文字修改圖片」以及「多張圖片合成與風格轉換」。 高保真影片生成 (Video Tools): 搭載 Google 最先進的 Veo 影片模型。只要您給出文字提示,我能生成帶有「原生環境音效」的高畫質影片。不僅支援純文字轉影片,還能透過參考圖片來引導影片生成,或是延伸既有影片的長度。 專業音樂生成 (Music Tools): 搭載 Lyria 3 音樂模型。我能透過您的文字、圖片甚至是影片,生成長達 30 秒的專業級音樂音軌。它支援精細的曲風、BPM 與情緒控制,甚至包含自動填詞與多國語言的逼真人聲演唱(註:生成的音軌皆會帶有 SynthID AI 浮水印)。 4. 專屬對話模式 (行動裝置限定) Gemini Live 即時對話模式: 若您使用 Android 或 iOS 手機版的 Gemini App,可以啟動這個模式。它允許我們像真人一樣進行無縫、可隨時打斷的即時語音對話。在手機上,您甚至可以向我 分享手機相機鏡頭畫面 或 螢幕操作畫面 ,我能直接「看」著您的畫面即時給出建議或協助。 系統會根據您當...