發票辨識系統:Gemini免費掃瞄1張會計憑證

發票辨識系統通常是付費的軟體工具,本文介紹如何應用Google的AI工具Gemini,它可以將手機照片整理成試算表的表格資料,實現免費掃瞄1張會計憑證的功能。

一、載具交易明細

範例是一張「載具交易明細」,它其實也就是發票明細,只不過實際的電子發票可能透過統一發票兌獎App存到載具中了,不過有需要的話,還是可以請店家幫忙列出像這樣的交易憑證出來。

在此是用手機拍照傳到電腦存檔,準備接下來的操作。

一、載具交易明細

二、Gemini上傳檔案

登入到Google的AI工具Gemini,提問框左下角有個「+」小圖標,點一下有兩個選項,選擇其中的「上傳檔案」,準備直接從自己的電腦上傳資料。

這裡還有另外一個選項,既然它是Google AI工具,Gemini使用技巧之一是很方便地結合自家產品。因此檔案若已經存在Google雲端硬碟的話,也可以選擇「加入雲端硬碟檔案」。

二、Gemini上傳檔案

三、選擇多張單據

在熟悉的檔案總管視窗中選擇桌面上的兩張照片,注意到這兩張其實是同一張照片,贊贊小屋在原地直接複製貼上,用意只是作為文章範例,表示在Gemini可以同時上傳多張照片。這應該很合乎實務上的需要,通常是有很多張的發票或者單據,能夠一次上傳多張當然會比較方便。所以Gemini好用嗎?從這個層面是非常滿意。

三、選擇多張單據

四、限定資料取得

依照贊贊小屋類似的使用經驗,通常Gemini是可以作為圖片轉文字工具,但沒想到它這次卻是回覆:「很抱歉,我無無法提供您想要的信息。」因為圖片中含有個人敏感資訊。贊贊小屋本來以為糟糕,任務要失敗了,但後來才想到發票上確實是有像載具或信用卡號等這樣的個人資訊,但其實在單據上就會自動將卡號隱密起來了。

綜合考量之後,贊贊小屋提出進一步需求:

「只要幫我提取日期、物品、數量、金額的資訊即可,不涉及個人隱私,幫我整理成表格。」

四、限定資料取得

五、生成表格修改

修正之後AI終於點頭,就跟Gemini Deep Research使用一樣願意幫忙了,不過它整理的表格有些可以再討論的空間:

首先是提供了兩張圖片,但它只整理一張。因為贊贊小屋先前有使用過多張發票的經驗,驗證了Gemini確實可以同時處理不同發票,針對這裡比較奇怪的狀況,也許AI已經自動辨識出是一模一樣的圖片,所以直接只處理一張。

另一個狀況是需求中清楚提出希望有日期,不過AI的回答是把日期放到了最下面,這對於後續資料整理會比較不方便,因此繼續提出需求如下:

「請把日期加到表格中,並且最後有個總計。」

五、生成表格修改

六、建立新試算表

就跟Deep Research怎麼用可能要細節調整一樣,經過再三的追加提問修改之後,Gemini總算給出了想要的答案:一個整理好的發票明細表格,而且它有個方便貼心的選項:「匯出到試算表」,點一下會提示「已建立新試算表」。實際去看的話,它會是在自己的Google雲端硬碟的主資料夾裡面,不過這裡也可以直接「開啟試算表」。

六、建立新試算表

七、發票辨識系統

延續上個步驟,瀏覽器會開啟一個新的標籤分頁,如同ChatGPT檔案下載一樣,這是Gemini自動產生的Google試算表,內容果然跟上個步驟所看到的回覆相同。如此便是簡單的發票辨識系統,手機拍攝之後上傳給AI免費辨識解析,得到紙本單據的明細資料之後,轉存到Google試算表,接下來可以使用種種的表格處理功能,包括編輯、查看、插入、格式等,節省了一定的時間,比較不需要再手工輸入原始資料。

發票辨識系統:Gemini免費掃瞄1張會計憑證

程式與AI的效率思考

如同文章所述,一開始Gemini回覆無法執行任務,贊贊小屋當下覺得糟糕,這個一定要做的事情沒辦法執行,後來是轉了個彎才順利完成任務。過程中具體瞭解到,AI畢竟不是程式,不是設計好程序就依照命令進行,AI是看起來會自主思考的模型,所以有可能直接說「No」!

因此有些情況AI做不到的,或許改由軟體系統去做。換個角度思考,就算是設計程式,受限於工具載體本身,也有程式沒辦法做到一百分,只能做到80分。AI也是如此,就算ChatGPT或Gemini不能夠幫忙做到一百分,其實只要有可以協助的空間,工作效率就會有所提升。

又或許有個第三方案,利用Claude寫程式的方式將兩者結合在一起,有時候會是很好的解題法,贊贊小屋個人心得,提供給讀者參考。


學會計、學Excel、學習AI工具,歡迎加入贊贊小屋社群

AI工具大全:8種不同功能用途和30個應用清單

ChatGPT怎麼用?Gemini是什麼?Notion教學

贊贊小屋AI課程:ChatGPT課程Notion課程

AI工具大全:8種不同功能用途和30個應用清單

最新文章: