再び脚光を浴びるOCRとその背景

再び脚光を浴びるOCRとその背景

「働き方改革」への機運の高まりにより、生産性の低い作業を自動化や効率化しようと盛り上がりを見せています。手入力業務を効率化できる技術としてOCRがあります。OCRといえば、何十年も前から活用されている技術ですが、「AI」や「RPA」という時代の変化を受けて、重要な技術として再び脚光を浴びています。
 今回は、なぜOCRが再び注目されているのか、昨今の技術の変化も踏まえて解説します。

 

OCRとは

 OCR(Optical Character Recognition/Reader、光学的文字認識)とは、手書きや印字を読み取り、デジタル化(コンピュータが利用できる文字コードに変換)する技術です。書類をスキャンして文字を抜き出し、ExcelやWordといったソフトウェアで扱える文字に変換するので、手入力する作業を効率化できるのです。

 

データ入力の自動化

 私たちの行う業務はAIやRPAなど、さまざまな技術によって大幅に改善することが可能になりました。しかし、未だ紙媒体で管理する業務が多く、紙からシステムへの入力作業が必要です。自社内であれば、はじめからタブレット端末を使用して入力するなど工夫ができますし、取引先とのやり取りであれば、EDIを活用するなど紙を介さずに取引をすることが可能です。しかし、すべての業務や取引先で紙媒体での管理を無くすことは難しく、どうしてもシステムへの入力作業が必要になります。そんな時に入力作業を効率化できるのがOCRです。

 

AIの技術により認識率が向上

 数十年前からあったOCRですが、問題もありました。日本語はひらがな、カタカナ、漢字と文字の種類が多く、誤認識されることが多々ありました。例えば、「白」と「自」など似た字は多く誤認識されていました。しかし、ここ数年で発展したAI技術を活用し、認識率は大幅に向上しました。AIを活用したOCRは以下のような流れで利用できます。

・OCRで書類から手書きや印字の文字を読み取り。
・その際、読み取った情報が不正確であってもAIが自動で補正。
・補正後、デジタル化された文字を人間が確認し修正。
・修正をしたデータをRPAでシステムに自動入力。

 AIの活用により、以下のことが可能になりました。
・論理的な推論や経験から読み取った情報を自動で補正することが可能。
・誤認識した文字をAIが学習し文字認識精度が向上。
・非定型レイアウトの書類からAIが学習して必要項目を抽出。

 人間による確認と修正が必要にはなりますが、修正を行うたびに自社内でよく使う言葉や業界用語などを学習し、読み取り精度が向上していきます。AI技術により発展したAI-OCRの登場で、認識精度が大幅に向上し、再びOCRに注目が集まっているというわけです。

 

データが”つながる”時代に

 日本版インダストリー4.0といわれる「コネクテッドインダストリーズ」では、データの”つながり”が重要になってきます。システム間や企業間など、さまざまなところでデータが”つながる”時代には、データを持っていること自体に重要な意味が出てきます。重要であるデータの入力処理を効率的に行うために、今後OCRは更に利用されていくと考えられます。

 しかし、どれほどOCRの技術が進んだといっても100%正確に認識するわけではないので、完全に自動化することはできません。人が確認する作業を交えながらOCRを活用し、いかに業務を効率化できるかが重要になります。

Share this...
Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn