AI-OCRとは~電帳法改正とインボイス制度で再注目されるAI-OCR~

2023年01月19日

 

2023年10月1日からインボイス制度が開始され、2023年12月31日には改正電子帳簿保存法の猶予期間が終了することになります。特にインボイス制度に関しては、請求書等を発行する側だけでなく、受領する側にも対応が求められています。例えば、受領したインボイスに対して記載項目に不備がないかの確認が求められており、保存や管理の方法にも注意すべき点がいくつかあります。そのため、インボイス制度の開始に伴い特に経理部門において業務の複雑化が懸念されていますが、そのソリューションとしてAI-OCRが注目を集めているのはご存知でしょうか。
AI-OCRは、紙の文書や帳票に記載された内容からテキストデータを抽出するITツールです。登場からおよそ5年が経過し、また登場当初には大きな注目を集めたため、一度は導入を検討したことがあるという企業も多いと思われます。
今回は、AI-OCRとはどのようなITツールなのかといった基本を振り返りつつ、インボイス制度と改正電子帳簿保存法という新たな課題に対してAI-OCRは活用できるのかを整理していきます。

 

AI-OCRとは

 

OCRとは、画像データから文字情報を認識しテキストデータに変換する機能です。
OCRの歴史は古く、PCが一般家庭に広く普及する以前から存在しており、技術進歩とともに文字認識の精度が引き上げられてきました。近年のOCRでは、文字の読み取り性能を引き上げるためにAI技術を取り入れたAI-OCRが主流です。
AI技術とは、「機械学習」、「深層学習(ディープラーニング)」の2つを取り入れていることを指しています。

 

◆機械学習

人間の手によって着目すべきポイントを指定すると、AIはその指定されたポイントについて学習し、正解を導き出せるようになっていきます。
例として、画像データから犬と猫を自動的に識別するAIを仮定して説明しましょう。機械学習では、その動物の「顔の形」を見て判断するように、AIに対してポイントを指定します。するとAIは、犬と猫の画像の「顔の形」の部分を見てデータを蓄積し、その蓄積されたデータを基にして、画像に映された動物が犬か猫かを識別できるようになっていきます。

 

◆深層学習(ディープラーニング)
深層学習では、着目すべきポイントをAIが自ら判断します。犬と猫を識別するAIの場合、深層学習では、AIに様々な犬と猫の画像を見せていくと、「顔の形」の部分に注目して判断すれば良いことをAI自ら発見します。さらに、「顔の形」だけではなく「尻尾の形」、「足の形」、「体毛の色」等と自ら識別するためのポイントを追加していくようになります。自ら発見したポイントに従ってデータを蓄積し、識別精度を上げるというものです。

 

特に深層学習には膨大なデータを読み込ませる必要があります。技術的な進歩によって学習が容易になった点は、近年AIが普及した大きな理由といえるでしょう。

 

「機械学習」や「深層学習」を取り入れたAI-OCRでは、予め決められたロジックで文字を読み取るのではなく、学習した内容に基づき識別するためのポイントを見出して読み取ることができるようになりました。

 

AI-OCRの特長

 

AI技術の「機械学習」や「深層学習」を取り込んだ結果、AI-OCRは「識字率の向上」、そして「非定型帳票への対応」を実現しました。

 

◆識字率の向上
通常のOCRでも手書き文字の読み取りは可能でしたが、実際には予めOCRが想定していた形の範囲内でなければ読み取ることが困難でした。枠が指定されていないフリーフォーマットで書かれた文字になると、文字の大きさ等も異なってくるため、実用に足るだけの読み取り精度を発揮できなかったのが実情でした。
しかし、AIの技術を使うことによって、想定していなかった形を読み込んだ場合にも特徴を学習していくことで、正しく文字を判断できるようになりました。

 

◆非定型帳票への対応
AIを搭載する以前のOCRで読み取る場合、例えば苗字、名前、会社名、住所、金額等、情報が紙上のどこに書かれているかを事前に指定しておく必要がありました。宅配便の送り状のような定型帳票であれば問題ありませんが、ビジネスで使用する書類には非定型のものが多数あります。取引先から送られてくる注文書や請求書等、細かいレイアウトは各社各様です。
AI-OCRでは、読み込んだ文字がどのような情報かを自動的に識別できるようになりました。つまり、会社ごとにフォーマットが異なる非定型帳票から、社名、商品名、金額等の情報を識別・判断しながら読み取るということです。

 

AI-OCRでは、AIの技術の活用により、手書き文字を含めた識字率が格段に向上し、また取引先から送られてくる各種各様の書式に合わせて帳票を自動的に読み取ることが可能となりました。

 

 

 

AI-OCR各製品検討におけるポイント

 

現在、世の中には様々なAI-OCR製品が出ていますが、どのような文字や書類でも100%読み取れるといった、人と同等のレベルで文字を読むOCRは、残念ながらまだありません。そのため、数ある製品の中から自動化したい紙業務に合ったAI-OCR製品を選択する必要があります。

 

◆製品がカバーする機能範囲
AI-OCRは、製品によって対応できる機能の範囲が異なります。読み取ったデータを構造化して業務システムやITツール等と連携させる機能を有した製品や、シンプルに文字の読み取りだけを行う製品、領収書等の特定の書類の読み込みに特化した製品も存在します。
価格の違い等もあるため製品の優劣をつけることは難しいですが、自社で実現したい用途・作業内容を明確にして、それに合わせた運用ができる製品を選ぶ必要があるでしょう。

 

◆製品の得意領域の理解
AI-OCRは、製品ごとに得意とする領域が異なります。大きな着目点としては、次の2点を挙げることができます。
・手書き or 印字
・定型帳票 or 非定型帳票
例えば、フリーフォーマットに手書きで書かれた情報を読み取りたいところに、印字かつ定型帳票の読み込みが得意なAI-OCR製品を選んでも、識字率は上がらず効率が落ちてしまいます。自社の紙業務がどの領域に該当するかを分類したうえで、それを得意領域とする製品を探す必要があります。

 

なお、より良い製品を選ぶためにお勧めしたいのが、事前の検証です。
AI-OCRベンダーの多くは、本格導入の前に何らかの形で事前検証ができるようなサービスを提供しています。例えば、読み込ませようと考えている実際の書類に対して期待通りに読み取りできるかを数値化して確認する、といった読取検証サービスなどがあります。現場でどのくらい作業時間を短縮できるかを計算するうえでも役立てることができますし、もし仮に正確に読み取れなかったとしても、読み間違いを起こすパターンを把握することで対策を取ることができるかも知れません。

 

自社の紙業務の特徴を理解し、AI-OCR製品の得意領域とマッチするかどうかを、事前検証サービス等を活用しつつ確認することがAI-OCRの導入では重要です。

 

 

電帳法改正とインボイス制度対応での活用方法

 

AI-OCRは2017年頃に登場した製品です。機能向上やバージョンアップが続けられているとはいえ、良い意味でも悪い意味でも、AI-OCRによってなにが出来るのかは既に多くのビジネスシーンで検証されてきたものになります。
そのようなAI-OCRが今再び注目を集めているのは、インボイス制度と電子帳簿保存法の改正による影響が大きいと言えるでしょう。
冒頭に記載した通り、2023年10月1日からインボイス制度が開始され、2023年12月31日には改正電子帳簿保存法の猶予期間が終了することになります。

 

インボイス制度においては、請求書等に記載されたインボイスの登録番号の確認や記載項目の不備がないかの確認を、請求書を受領する側に求められています。また、従来までは不要だった3万円未満の請求書等についても、インボイス制度では金額に関係なく保存する義務が定められました。つまり、管理すべき請求書の枚数自体が大きく増加してしまう恐れがあるということです。
受領した請求書ごとにひとつずつ確認していくのは非常に手間がかかることでしょう。
そのため、データとして作業や管理が可能となる電子インボイスが注目されています。また、紙ベースのインボイスと電子インボイスの混在を防ぐため、紙ベースのインボイスをデータとして取り込み、データ上で一括管理したい、と考えている企業が増えています。

 

一方、電子帳簿保存法の改正によって、電子取引における国税関係書類をデータで保存することが義務化されました。
そのため、電子インボイスは電子帳簿保存法に則って管理される必要があります。つまり、これまで全ての書類を紙で管理していたような企業も、今後は電子データでの保存にも対応できる必要があるのです。また、データの管理方法についても取引先名、取引日付、取引金額の3項目を検索可能にすることが義務づけられており、ただデータを保存していれば良いわけではありません。

 

そこでAI-OCRを活用し、各社各様のフォーマットで記載されている文字情報を自動で読み取ることによって、膨大な書類を効率的にデータとして取り込み、経理業務の負担を減らしたいといったニーズが高まっています。
AI-OCRの機能を活用すれば、取引先から送られてくる請求書に記載された文字情報から、それがインボイス登録番号、取引先名、日付、金額といった項目であることを自動的に識別してくれるので、作業者に負担をかけることなく効率的なデータ入力が可能です。電子帳簿保存法によって定められている、項目ごとの検索が可能な形で保存する点についても、AI-OCRの機能で対応することができます。
また、AI-OCRで読み取った情報をRPA等、他のITツールと組み合わせることで、例えば原本となるデータを自動的に分類しつつ整理・保存する際に活用できるでしょう。CSV連携等で社内システムへの入力作業を自動処理させるといった使い方も可能です。

 

以上のようにインボイス制度によって複雑化する業務を、AI-OCRの機能を活用することで解消・緩和しようと考える企業も増えています。

 

 

まとめ

 

・AI-OCRとは
AI-OCRとは、AI技術である以下の2つの機能を取り入れたOCRです。
◆機械学習:AIが着目すべき点を人が指定したうえで学習
◆深層学習:AIが自ら着目点を判断したうえで学習

 

・AI-OCRの特長
◆識字率の向上
これまでは指定された様式に丁寧に書いた文字でなければ読み取りが困難だったが、OCRで読み取ることを意識していない文字でも読み取り精度が向上
◆非定型帳票への対応
これまでは各項目の位置を事前に指定しなければならなかったが、事前に指定しなくても読み取った文字が何を表しているか判別可能

 

・AI-OCR各製品検討におけるポイント
◆製品がカバーする機能範囲
◆製品の得意領域の理解(手書き or 印字、定型 or 非定型)
また、上記2点を踏まえてベンダーの事前検証サービスを使い、本導入前に読み取り精度を確認しておくことをお勧めします。

 

・電帳法改正とインボイス制度対応での活用方法
インボイス制度によって、請求書等のインボイスの各種確認作業が増え、また管理が必要な書類そのものも増加します。紙ベースで1枚ずつ確認するのは、主に経理部門において大きな負担増になると予想されています。また一方で、電帳法改正により電子帳簿の管理についても厳格化が進められました。そこで、紙ベースによる帳票を全てデータで管理しようする流れから、AI-OCRが改めて注目を集めています。
AI-OCRの機能を活用することで、インボイス番号や日付等の情報を自動的に判別してくれるため、チェックや保存の際の分類や管理に有効です。また、RPA等、他のITツールと連携することで活用の幅はさらに広がるでしょう。

CONTACT

経理、監査、情報システムに関するお悩みなど
お気軽にご相談ください

お電話でのお問い合わせ
受付時間:平日10:00~19:00
お気軽にお電話ください
03-6230-9526
フォームからのお問い合わせ メルマガ登録

認証フォーム

※お名前・メールアドレスを入力するとすぐに資料がご覧いただけます。

氏名必須
メールアドレス必須